ГМЦ Росстата приступает к созданию единой сводной базы данных с итогами переписи
18:00, 7 июня 2011 Мария Соловьева
В Главном межрегиональном центре обработки и распространения статистической информации (ГМЦ Росстата) продолжается обработка данных Всероссийской переписи населения 2010 года, окончательные итоги которой будут подведены в 2013 году.Обработка материалов для получения итогов Всероссийской переписи населения осуществляется с помощью автоматизированной системы – АС ВПН 2010, разработанной на базе новейших технологических решений с учетом отечественного и зарубежного опыта.
В АС ВПН-2010 предусмотрена интегрированная система обеспечения информационной безопасности и защиты от несанкционированного доступа на региональном и федеральном уровнях. Система полностью обеспечивает конфиденциальность первичных данных, полученных в ходе опроса населения.
Автоматизированная обработка данных переписи населения проходит в два этапа. Сначала обработка переписных листов проводится в региональных центрах обработки.
Центры регионального уровня автоматизированной обработки находятся в 68 из 82 территориальных органов Росстата. Причем отдельные такие центры обрабатывают не только переписные листы «своих» территорий, но и переписные листы соседей. Например, в Архангельске обрабатывают переписные листы Ненецкого автономного округа, или в Тюмени - переписные листы Ханты-Мансийского и Ямало-Ненецкого автономных округов.
Сначала переписные листы сканируются и производится сохранение информации переписных листов в виде электронных пачек на сервер. При сканировании получают два файла: электронный вид переписного листа и файл для формирования обезличенных баз данных.
Электронный вид переписного листа используется для проведения верификации и дальнейших контролей информации (экранное кодирование записей переписчика и формальный и логические контроли). После завершения обработки Росстат передаст электронные образы переписных листов (с соответствующим программным обеспечением) в государственный архив для постоянного хранения. Правила хранения переписных листов и иных документов Всероссийской переписи населения 2010 года утверждены постановлением Правительства Российской Федерации.
Для сканирования используются быстродействующие отечественные сканеры для ввода, а также распознавания информации, записанной цифрами или графическими метками. Скорость сканирования – до 150 бланков в минуту. На этих сканерах осуществлялся ввод данных Всероссийской переписи населения 2002 года, Всероссийской сельскохозяйственной переписи 2006 года. Это перепись для них третья.
Кстати, технология автоматизированного ввода информации переписей населения в нашей стране используется, начиная с Всесоюзной переписи населения 1970 года.
Далее идет процесс экранного кодирования. Мы помним, что переписчик при опросе заполнял в переписном листе метки (крестики), цифры и по отдельным вопросам записывал наши ответы словами: названия субъектов Российской Федерации или стран мира, где опрашиваемые родились или откуда приехали в данный населенный пункт, национальную принадлежность и владение языками. На этом этапе оператором производится кодирование информации на основе различных справочников и словарей. Они «вшиты» в программное обеспечение. Это официальные классификаторы, например, перечень национальностей. На экран выводится этот перечень на определенную букву, каждая национальность имеет цифровой код, а также запись переписчика. Оператор видит запись переписчика, сам классификатор и присваивает код этой записи.
Далее проводятся формальный и логический контроли информации переписных листов. Формальный контроль заключается в проверке по каждому вопросу переписного документа на наличие ответа, его соответствие допустимому диапазону значений, указанному в переписном листе. При логическом контроле оператор устраняет все «нелогические» ошибки переписчика. Например, в переписных листах заполнена информация на детей, имеющие высшее образование или ученые степени.
К концу мая сканирование и контроль информации переписных листов завершились во всех регионах. Не позднее 10 июня т.г. из каждого регионального центра записанная на DVD-носителях информация полностью поступит в ГМЦ Росстата.
Всего же за пять неполных месяцев статистики обработали почти 195 миллионов переписных листов различных форм – Л (заполнялись переписчиками на постоянных жителей страны), П (заполнялись на помещение), В (заполнялись на лиц, временно находившихся в стране).
На основе этих DVD-носителей в ГМЦ Росстата будет создана сводная база данных по всем субъектам Российской Федерации, на основе которой будут сформированы итоговые таблицы для официального опубликования. В настоящее время и сам ГМЦ Росстата выполняет функции регионального центра по Центральному федеральному округу. Здесь, также как и в других регионах, осуществляется обработка информации переписных листов.
Федеральное государственное унитарное предприятие Главный межрегиональный центр обработки и распространения статистической информации Федеральной службы государственной статистики специализируется на обработке статистической информации для Федеральной службы государственной статистики с 1932 года. Тогда предприятие называлось «1-я фабрика механизированного счета» и было образовано на базе Технико-статистического объединения при Центральном управлении народнохозяйственного учета (ЦУНХУ) Госплана СССР. С тех пор оно выполняет свою главную задачу - сбор, обработку статистических данных и предоставление сводных данных органам государственной власти.
ГМЦ Росстата выполняет функции центра регионального и федерального уровней автоматизированной обработки. Здесь осуществляется ввод информации и проведение разного рода контролей переписных листов Москвы, Чукотки, граждан РФ, проживающих в городе Байконур, а также переписных листов, заполненных на моряков Черноморского флота.
Как центр федерального уровня, ГМЦ Росстата осуществляет «аккумулирование» всей введенной информации в субъектах РФ, формирование сводной базы данных по стране, из которой получают итоговые таблицы для официальной публикации. ГМЦ Росстата – это место, где можно увидеть весь процесс автоматизированной обработки и подведения итогов Всероссийской переписи населения 2010 года.
Подведение итогов, т.е. получение статистических таблиц осуществляется на основании Программы итогов Всероссийской переписи населения 2010 года, утвержденной приказом Росстата от 04.03.2010 г. № 113.
Таблицы Программы итогов Всероссийской переписи населения 2010 года сгруппированы по 10 тематическим разделам. В зависимости от сложности алгоритмов и временных затрат таблицы формируются в две очереди. В первую очередь будут получены таблицы, которые потребуют наименьшего времени для формирования, во вторую очередь разрабатываются остальные более сложные и трудоемкие таблицы. Финальные сроки получения рабочих таблиц:
I очередь – июнь 2012 г.;
II очередь – декабрь 2012 г.
Правительством Российской Федерации сформирована Рабочая группа по официальному опубликованию итогов Всероссийской переписи населения 2010 года. Возглавляет ее Министр экономического развития Э.С. Набиуллина.
Итоги Всероссийской переписи населения 2010 года Росстат будет распространять в виде своих официальных печатных и на электронных носителях изданиях (11 тематических томов), популярных изданий для широкого круга пользователей (брошюры, атлас, пресс-релизы, презентационные материалы), а также разместит на официальном сайте www.gks.ru и сайтах территориальных органов Росстата. Впервые в отечественной практике на сайте Росстата будет обеспечен WEB-доступ пользователей к неперсонифицированной информации переписи с соблюдением условий конфиденциальности