Российский межуниверситетский ресурсный и аналитический центр по гуманитарным исследованиям Rambler's Top100
РФФИ        Российский фонд фундаментальных исследований - самоуправляемая государственная организация, основной целью которой является поддержка научно-исследовательских работ по всем направлениям фундаментальной науки на конкурсной основе, без каких-либо ведомственных ограничений
 
На главную Контакты Карта сайта
Система Грант-Экспресс
WIN-1251
KOI8-R
English
Rambler's Top100
 

РОССИЙСКИЙ МЕЖУНИВЕРСИТЕТСКИЙ РЕСУРСНЫЙ И АНАЛИТИЧЕСКИЙ ЦЕНТР ПО ГУМАНИТАРНЫМ ИССЛЕДОВАНИЯМ

         Проблема информационного обеспечения науки и образования
         Информационная система "РОССИЯ"
         Ссылки

ИНФОРМАЦИОННАЯ СИСТЕМА "РОССИЯ"

С 1994 года коллективом Центра информационных исследований реализуется проект создания межуниверситетского информационного центра на базе Информационной системы РОССИЯ. Цель проекта - целенаправленное формирование информационной системы (электронной библиотеки), поддерживающей комплекс ресурсов социальной тематики федерального и регионального уровней.

На первом этапе в систему будут включены правовые документы, статистика, выборная статистика, ведущие средства массовой информации в центре и регионах, справочные данные по системе власти федерального уровня и регионов, научные журналы, бюллетени, вестники по гуманитарной тематике, аналитические материалы. Базовый комплекс источников составлен специалистами Центра социологических исследований МГУ в рамках проекта "Рабочее место социолога".

Информационная система будет работать в режиме коллективного пользования, и все региональные университеты на равных условиях получат возможность работать с информационными источниками.

Содержание и функциональные возможности системы позволят использовать ресурсы как надежный информационный источник и учебную и научную базу для исследований в области экономики, социальной сферы, культуры, права, истории, международных отношений, лингвистики, филологии, сравнительного языкознания. В рамках проекта предполагается осуществлять мониторинг проектов по социальным исследованиям и представлять результаты исследований.

С 1996 года базой проекта является Научно-исследовательский вычислительный центр МГУ им. М. В. Ломоносова (НИВЦ МГУ). Среди долгосрочных задач НИВЦ МГУ - создание и развитие комплексных информационных систем как учебной и исследовательской базы; разработка методик использования новых информационных технологий в образовательном процессе и научных исследованиях; координация межуниверситетских проектов по гуманитарным исследованиям с использованием информационно-вычислительных технологий на базе супер-ЭВМ; изучение и адаптация международных стандартов описания ресурсов и представления данных, перспективы Интернет-2 для образования и науки в России.

НИВЦ МГУ располагает технической базой, необходимой для реализации проекта. В 1999 году НИВЦ МГУ будет оснащен 32-х процессорным суперкомпьютером фирмы Хьюлетт-Пакард, что полностью снимет вопросы быстродействия и объема памяти на несколько лет вперед.

В НИВЦ МГУ реализован как лабораторная версия и эксплуатируется прототип Информационной системы РОССИЯ (ИС РОССИЯ). Прототип включает несколько информационных блоков: полные тексты официальных документов с 1994 года (эталонные версии, более 30000 документов, около 200 Мб), справочные данные по политической системе России, справочные данные по регионам (блок реализован на основе векторной карты), статистические массивы Госкомстата РФ, выборную статистику Центризбиркома РФ с 1991 года.

Прототип ИС РОССИЯ реализован на СУБД Oracle8. В рамках прототипа разработана технология автоматической лингвистической обработки текстов (АЛОТ) социальной тематики и автоматической загрузки результатов обработки в ИС РОССИЯ. Технология АЛОТ позволяет автоматически осуществлять содержательную обработку - индексирование, рубрицирование и аннотирование текстов документов, создание их развернутых поисковых образов (метаинформации).

В прототипе ИС РОССИЯ реализованы развитые поисковые возможности, в частности, поиск по рубрикатору (200 позиций) и тезаурусу (50000 терминов, 250000 иерархических связей), а также просмотр метаинформации и работа в системе на уровне метаинформации, ранжирование документов при выдаче на запрос пользователя. Технология позволяет интегрировать массивы и осуществлять сквозной тематический поиск по всему информационному комплексу. Учитывая, что для научных целей специалисты используют большой объем данных (широкий круг источников и ретроспектива, полные тексты документов), отбор и просмотр документов увеличивает время работы с ресурсами, и соответственно растут затраты на оплату каналов связи, реализованные в рамках ИС РОССИЯ технологические инструменты являются важным элементом с точки зрения рациональной организации поисковых возможностей для решения исследовательских задач и минимизации затрат.

В 1998 году технология АЛОТ была представлена на международную экспертизу по тестированию технологий обработки больших информационных массивов. Наиболее известной в мире является экспертиза, проводимая Национальным институтом стандартов США и Агентством по исследованиям в области передовых (военных) технологий (DARPA) Министерства обороны США, куда и обратился коллектив. По заключению экспертизы, результаты сопоставимы с достижениями лучших коллективов мира.

Научные разработки, техническая база, программные средства, квалификация коллектива позволяют создать и поддерживать информационную систему на уровне современных требований и международных стандартов, реализовать дополнительный пользовательский сервис: а) содержательный анализ каждого документа, что позволит сократить время и усилия на стадии отбора, просмотра, сортировки информации (по оценкам экспертов, более половины времени исследователей уходит на этот этап работы); б) интеграция массивов и возможность сквозного тематического поиска по всей совокупности источников и получение комплекса документов; в) динамический мониторинг ситуации в каждом регионе по оценкам различных СМИ, в том числе региональных; г) сравнение оценок; д) сопоставление выводов по материалам аналитических докладов, научных статей.

В рамках проекта будут организованы совместные скоординированные работы университетов России, желающих и готовых сотрудничать в развитии информационного ресурса: созданные коллективом методики и программно-лингвистические средства будут бесплатно переданы региональным университетам для создания информационных систем на базе местных источников. Региональные университеты смогут достаточно быстро накапливать свои информационные ресурсы, используя готовые средства частично или полностью. Единая методика и технология обеспечат унификацию работы с документами и данными и создание интегрированной информационной системы, сэкономят региональным университетам значительные средства и время на создание средств обработки и индексирования документов: Информационная система на СУБД Oracle разрабатывается группой из 6 программистов в течение 6 лет с участием американских консультантов, комплекс программно-лингвистических средств для ИС РОССИЯ создавался коллективом из 10 специалистов-лингвистов в течение 6 лет при поддержке российских и зарубежных фондов.

В рамках межуниверситетской схемы распределения работ на базе НИВЦ МГУ будет осуществляться обработка ресурсов федерального уровня - официальных документов, СМИ (создание электронных досье на базе газет и журналов, сообщений информационных агентств по 200 темам, 89 регионам), статистических массивов Госкомстата РФ и Центризбиркома РФ. Формирование массивов федерального уровня будет осуществлено путем закупки комплекса электронных ресурсов, представляющих первостепенный интерес для гуманитарных исследований с их оперативным обновлениям по телекоммуникационным каналам связи. Список базовых источников составлен специалистами Центра социологических исследований МГУ им. М. В. Ломоносова и включает более 20 источников, в том числе около 10 электронных изданий СМИ. В перспективе список источников будет расширяться с учетом предложений всех заинтересованных исследовательских коллективов, финансовых возможностей и готовности владельцев предоставлять ресурсы для коллективного использования в исследовательских и учебных целях.

Проведены переговоры с руководителями электронных изданий, включенных в список базовых источников. Владельцы ряда информационных ресурсов готовы предоставить для настоящего проекта специальные условия: льготная оплата закупки, возможность предоставления доступа к ресурсам после их содержательной обработки в составе ИС РОССИЯ для университетов России.

На первом этапе Информационная система РОССИЯ будет поддерживать следующие основные блоки:

Российская Федерация:

  • правовые документы РФ - полная коллекция (эталонная версия) законов, указов Президента, распоряжений правительства, постановлений высших судебных органов, других нормативных документов с 1991 года;
  • статистика Госкомстата РФ, Центробанка РФ;
  • выборная статистика Центризбиркома РФ;
  • справочные данные по политической системе России (полномочия, структура, состав, персоналия высших органов власти).

Регионы России

(Блок реализован на основе векторной карты):

  • нормативные документы регионального уровня (конституция, договоры о разграничении полномочий с федеральными органами власти, распоряжения местных органов власти);
  • административное деление;
  • политическая система (структура, состав, персоналия местных органов власти);
  • экономическая, социальная статистика;
  • результаты голосований по выборам федеральных органов власти;
  • результаты голосований по выборам местных органов власти;
  • СМИ регионального уровня - обработка электронных версий местных изданий;
  • СМИ федерального уровня - сообщения о регионе.

Средства массовой информации

  • электронные досье на основе сообщений информационных агентств (ИТАР-ТАСС, Восточно-Европейская пресс-служба), газет ("Известия", "Финансовая газета", "Независимая газета", "Аргументы и факты", "Коммерсант", "Сегодня", "Правда");
  • электронные версии региональных газет - к концу 1998 года около 200 региональных изданий имели электронные версии (лишь немногие - полные аналоги печатного издания, остальные - сокращенные варианты, еженедельные выжимки). В рамках проекта ряд электронных версий региональных СМИ будут предоставлены владельцами бесплатно. Региональные СМИ будут обрабатываться на базе единого рубрикатора и тезауруса и включаться в электронные досье (около 200 тем, 89 регионов). Интеграция электронных версий местных СМИ с ИС РОССИЯ значительно расширит читательскую аудиторию для местных СМИ. Увеличится содержательная ценность ИС РОССИЯ за счет источников из регионов, будет обеспечен более точный мониторинг ситуации в регионах, возможность сравнения оценок на региональном и федеральном уровне.
  • научные журналы, имеющие электронные версии: "Вопросы экономики", "Политологические исследования", Вестники МГУ "Экономика", "История", Бюллетень "Регионы России" Института "Восток-Запад", аналитические доклады, материалы научных конференций.

К участию в проекте будут привлечены факультеты МГУ, другие университеты, институты РАН и исследователи - создатели баз данных, на втором этапе - разработчики учебных курсов и оригинальных методик анализа социальных процессов.

В рамках проекта решается комплекс правовых вопросов, связанных с закупкой НИВЦ МГУ информационных источников в электронной форме для коллективного использования университетами России в рамках интегрированной ИС РОССИЯ после обработки на основе технологии АЛОТ.

Проект позволит начать сотрудничество по развитию коллективного информационного ресурса и формирование единого информационного пространства российских университетов. Как ожидается, первыми включатся в совместные работы университеты - участники программы "Университетские центры Интернет", где уже создана аппаратно-программная платформа для реализации сотрудничества. Проектом предусмотрены отдельные формы работы с региональными университетами, не имеющими доступа в Интернет. Реализация проекта будет способствовать эгалитарности университетского и всего научного сообщества России.

В рамках проекта реализуются международные стандарты представления ресурсов, что обеспечит совместимость с мировыми информационными ресурсами и расширит возможности совместных исследований с зарубежными специалистами.

Предполагается, что в перспективе Информационная система РОССИЯ будет доступна через публичные библиотеки страны. В регионах растет число библиотек, имеющих доступ в Интернет. Информационная система РОССИЯ станет для них дополнительным надежным ресурсом для обслуживания населения, независимых аналитических центров, общественных движений и неправительственных организаций, обеспечивая доступ к правительственным документам, статистике, СМИ и другим источникам важной социальной информации. Региональные библиотеки смогут предоставлять полные тексты законодательных документов. Эта функция межуниверситетской информационной системы будет содействовать правовой поддержке населения, поднимет значение библиотек как центров общественной жизни на местах.

Как показал мировой опыт, университеты играют ведущую роль в истории развития Интернет. Университеты России также могут стать движущей силой развития Интернет-технологий в стране, способствовать повышению общей информационной культуры в регионах и вхождению России в мировое информационное сообщество.

   
Copyright © 1997-2007 РФФИ Дизайн и программирование: Intra-Center