AIM
3 Sholudenka st., office 310 04116 Kyiv, Ukraine
+380442909435 info@aimarketing.info
Послуги AIM, спробуйте зараз!
Logo AIM
article picture

Оцифровування статистики, або Перша їжа для Bigdata

Yuriy Shchyrin
Автор: Yuriy Shchyrin
Перегляди: 315
Оцініть сторінку
0
08
September 2015


З усіх мільйонів цифр української статистики лише жалюгідні відсотки корисні для росту економіки та розвитку ринків.

Дівчина вмикає комп'ютери
Хоча збір статистики - це аж ніяк не марне заняття в сучасному світі, але тільки в тому випадку, якщо вона коректно оброблена і подана.

Тоді сухі цифри конвертуються в живі гроші.

Вперше з моменту оголошення незалежності України чиновники, нарешті, глобально перейнялися, які дані про життєдіяльність держави вони подають його громадянам, бізнесменам і журналістам.

Кабмін допрацював проект постанови про правила публікації відкритих даних. Про це в Facebook повідомив директор департаменту інформаційних технологій при Мінекономрозвитку Єгор Стефанович.

Зараз відомство погоджує документ з іншим міністерствами, а в вересні розраховує на його затвердження урядом.
Постанова - це наступний крок після прийняття в квітні 2015 року закону про доступ до публічної інформації в формі відкритих даних. У лютому його вніс до парламенту президент Петро Порошенко.


Що таке відкриті дані

Впровадження відкритих даних в Україні - це ініціатива ООН. Такими даними можна назвати статистику, реєстри, звіти, цифри, рішення, документи, що стосуються всіх сфер життєдіяльності держави.

Основним контролером процесу оприлюднення відомостей стало, згідно з прийнятим законом, Держагентство з питань електронного уряду. Згідно з проектом постанови Кабміну, щорічно до 15 лютого держоргани повинні будуть відзвітувати перед цим агентством про публікацію даних.
У цього нововведення є три глобальні цілі: забезпечення прозорості діяльності державних органів, боротьба з корупцією та створення підмоги для запуску інноваційних сервісів в Україні.

Згідно з проектом постанови, відомства будуть зобов'язані регулярно викладати відкриті дані на своїх сайтах і дублювати їх на єдиний держпортал відкритих даних в чітких форматах.
Всього в проекті вказано 290 масивів даних, які повинні будуть зробити загальнодоступними міністерства. Керівник робочої групи з відкритих даних при Кабміні Денис Гурський повідомив ЕП, що це тільки початок.

"Мій KPI (Key Performance Indicators або по-простому - фронт робіт. - Авт.) - 30 тис наборів даних через рік", - підкреслює він. Зараз, за ​​його словами, на сайтах міністерств і держорганів практично нічого немає, тому багатьом доведеться викладати дані заново в необхідних форматах.

Основний майбутній джерело інформації про Україну - єдиний портал відкритих даних - вже створено і працює в тестовому режимі. Ним став створений в 2011 році за підтримки громадської ініціативи Social Boost, "Майкрософт Україна" та фонду "Відродження" сайт data.gov.ua.



Не корисна інформація


Відповідно до прийнятого закону, відкриті дані можна буде вільно копіювати, публікувати, поширювати і доповнювати, в тому числі - в комерційних цілях.
Як помітив засновник одеського коворкінг-центру "Термінал 42", екс-директор компанії "Яндекс Україна" Сергій Петренко, важливо, що міністерства тепер зобов'яжуть публікувати дані в машиночитаемом форматі.

Він нагадує, що при роботі "Яндекса" з державою по ряду проектів формат видачі інформації був основним головним болем. Особливо багато складнощів виникало з сервісом "Яндекс. Розклади".

Якщо дані про розклад поїздів можна було взяти в електронному вигляді в доступному джерелі, то з розкладом приміських електричок була біда.
В Україні шість залізниць, і дані в розкладі електричок регулярно змінюються. В результаті, зміни в розкладу доводилося вносити вручну: на факс надходили телеграми, дані з яких оцифровувати. З колегою погоджується представник компанії "A + S в Україні" Дмитро Беспалов.

"У транспортних інженерів є приказка:" Даних багато не буває ". Однак тут ще важливий пункт - правильний формат даних. У нас був досвід: дані начебто є, і вони для нас відкриті, але формат їх такий, що отримати з них потрібну інформацію ніяк вийде ", - підкреслює він.

За його словами, варто говорити не стільки про відкритість даних, скільки про їх стандартизації. "Тоді і інфраструктуру можна планувати", - говорить експерт.
У проекті постанови написано, що дані повинні не тільки вміти відображатися на сайті, але і бути готовими до того, щоб стати частиною нових сторонніх додатків і послуг. "На таких даних можна будувати журналістські розслідування і за пару днів організовувати стартапи", - говорить Гурський.


Нові сервіси та Bigdata

Заступник директора дослідницької компанії GfK Ukraine Гліб Вишлінський прогнозує, що першими споживачами добре структурованих госданних стануть професійні аналітики.
"Наша компанія зможе завантажити базу ЄДРПОУ та проводити опитування підприємств, телефонуючи на випадково обрані номери, а не виколупувати їх по рядку.

На сайті Держстату дані будуть в таблицях з рядами даних, а не в вордівських файлах. Це тільки перші приходять в голову приклади"
, - розповідає він.
Заступник директора дата-центру "Парковий" Денис Бурдук передбачає, що після відкриття даних почнуть з'являтися платні аналітично сервіси.

На його думку, такі дані також є масивом для BigData-алгоритмів - програм, які швидко аналізують мільйони, здавалося б, незв'язаних даних і видають несподівані взаємозв'язку і прогнози щодо розвитку галузей.

Згідно з прогнозами дослідників європейського проекту по великим відритим даними Bigopendata.eu, до 2020 року відкриті дані принесуть Європі 206 млрд євро. В першу чергу - завдяки прийняттю рішень, підкріплених точними відомостями, а також за рахунок збільшення ефективності бізнес-процесів.



Не все так просто


Публікація відкритих даних - це процес, який таїть в собі безліч підводних каменів. Наприклад, чи зможуть держоргани готувати дані, чи будуть їх регулярно оновлювати, і скільки на це піде державних коштів.

Вишлінський вважає, що нічого складного в цьому немає: зібрати дані в xls зможе навіть чиновник з зарплатою 3 тис грн.
Петренко звертає увагу на ще один важливий нюанс: чи впорається ресурс data.gov.ua з великим навантаженням. Він бажає виконавцям проекту удачі.
Бурдук додає, що портал повинен буде на гідному рівні забезпечити безпеку зберігання і обробки даних, адже від них буде залежати безперервність роботи багатьох програм.
Беспалов турбується про те, що деякі дані, які будуть надавати відомства, виявляться марними, так як будуть неповними.

"Наприклад, нам дали дані про перспективні забудовах в Києві. Пишуть: ххх кв м житла. Розташування: вулиця Дегтярівська. Відмінно! Ця вулиця близько 3 км в довжину, і в неї потрапляє, напевно, 12-15 транспортних районів. Куди ж віднести ці метри? Але дані начебто є. все в таблицях, все красиво ", - відзначає він.

Те ж, за його словами, може вийти з масивами даних по ДТП, які також потрапили в розряд відкритих. У них може бути вказана дата події на перетині тих чи інших вулиць. Щоб аналізувати ці відомості, потрібні координати точок, час, учасники, попередні причини.
"Я буду радий помилитися і побачити дані в повному вигляді", - резюмує Беспалов.

Джерело: Стас Юрасов, ЕП

Оцініть сторінку
0
Сподобалось? Поділись у соцмережах:
Потрібна допомога спеціаліста? Звертайтеся до нас вже сьогодні
blog sidebar cta image
Потрібна допомога спеціаліста?
Блог
Огляд ринку сухих гіпсових сумішей
Який він - огляд ринку сухих гіпсових сумішей?
Читати
Ринок сухих цементних сумішей за перше «Карантинне» півріччя 2020
Завдяки чому деякі компанії на ринку СЦС вийшли в топ, а інші втратили частку ринку за перше півріччя кризи.
Читати
Склопластик -від яхт до футуристичної архітектури
Історія винаходу склопластику, його властивості, сфери застосування. Склопластик у будівництві та архітектурі.
Читати
Огляд ринку скляного волокна
Об'єм ринку скловолокна загалом, частки ринку за виробниками.
Читати
Щомісячний моніторинг ринку теплоізоляційних матеріалів. Огляд першого півріччя 2020 року....
Динаміка ринку ТІМ під час першого кризового півріччя. Зміна тенденцій, частки на ринку постачальників мінерал...
Читати
Ринок геліосистем – 2019. Частина 2: сонячні колектори.
Частка та тенденції сонячних колекторів на ринку, країни-виробники та бренди.
Читати
Ринок геліосистем – 2019. Частина 1. Сонячні (пласкі) панелі.
Динаміка ринку сонячних пласких панелей, частка ринку в сенменті, тенденції.
Читати
Оновлення карти будівельних об’єктів АІМар - v2.0
Реліз оновлень інтерактивної карти будівельних об'єктів України.
Читати
Щомісячний моніторинг ринку OSB
Моніторинг ринку OSB
Читати
Ринок теплових насосів
Попит на ринку, частки ринку за видами та брендами.
Читати
Огляд ринків алкогольних напоїв та склотари за перше півріччя 2020 р.
Сегменти-лідери та динаміка ринку.
Читати
Ринок побутових котлів 2014-2019
Тенденції ринку, об'єми продажів побутових котлів за сегментами, показники в штуках та в гривні.
Читати