=Paper= {{Paper |id=None |storemode=property |title=Технология создания комплексированных индексов публикационной активности (The Technology of Aggregated Science Citation Indexes Formation) |pdfUrl=https://ceur-ws.org/Vol-934/paper6.pdf |volume=Vol-934 |dblpUrl=https://dblp.org/rec/conf/rcdl/ObuhovaZS12 }} ==Технология создания комплексированных индексов публикационной активности (The Technology of Aggregated Science Citation Indexes Formation) == https://ceur-ws.org/Vol-934/paper6.pdf
    Технология создания комплексированных индексов
              публикационной активности

       © Обухова О.Л.                   © Заикин М.Ю.                           © Соловьев И.В.
                              Институт проблем информатики РАН
                                            Москва
     obuhova@amsd.com                  maxim@amsd.com                          vanya@kakoe-to.ru


                 Аннотация                              научной информации (Institute of Scientific
                                                        Information) США, в статье «Science Citation Index-A
   В статье дан анализ требований к форми-              New Dimension in Indexing» [3] вводит понятие
   рованию показателей, на основе которых               индекса цитирования: «...это упорядоченный список
   производится оценка результативности                 цитированных статей, каждая из которых сопрово-
   научных организаций в соответствии с                 ждается списком цитирующих статей. Цитирующая
   Приказом Министерства образования и                  статья определяется как источник, а цитируемая –
   науки № 406 от 14 октября 2009 г.                    как ссылочная. Любая статья-источник может
   Для автоматизации процесса получения                 впоследствии стать ссылочной».
   данных о публикационной активности                       В настоящее время понятие «индекса цитиро-
   сотрудников     научно-исследовательского            вания» используется, в широком смысле, для
   института, как одного из критериев науч-             обозначения специализированной информационной
   ного вклада организации, разработана                 программной системы, в которой собирается и
   технология, заложенная в основу информа-             обрабатывается полная библиографическая инфор-
   ционно – поисковой системы, разрабатыва-             мация о журнальных статьях и списках цитируемой
   емой в ИПИ РАН.                                      литературы. Такая база данных позволяет находить
   В качестве одного из прикладных результа-            как публикации, цитируемые в отдельно взятой
   тов работы системы приведена статистика              статье, так и публикации, цитирующие эту статью.
   цитирований в статьях, опубликованных в              Анализ библиографических ссылок позволяет
   трудах конференции «Электронные библио-              получить количественные показатели цитирования,
   теки: перспективные методы и технологии,             к примеру, суммарный объём цитирования или
   электронные коллекции» (RCDL) за послед-             индекс Хирша. -индекс, или индекс Хирша —
   ние 4 года.                                          библиометрический показатель, предложенный в
                                                        2005 г. американским физиком Хорхе Хиршем [5]
1 Введение                                              из университета Сан-Диего, Калифорния. Индекс
                                                        Хирша является количественной характеристикой
   Одним из показателей научного вклада
                                                        продуктивности учёного, основанной на количестве
интеллектуальных работников является публика-           его публикаций и количестве цитирований этих
ционная активность, определяемая количеством            публикаций. Индекс вычисляется на основе распре-
публикаций автора и числом их цитирования, для
                                                        деления цитирований работ данного исследователя.
подсчета которого используются библиографичес-
                                                        Хирш пишет: «Учёный имеет индекс , если из его
кие ссылки научных статей. Пристатейные списки
                                                        Np статей цитируются как минимум раз каждая, в
используемой литературы – «это кодовый язык,
                                                        то время как оставшиеся (Np — ) статей цитиру-
позволяющий представлять публикации в ком-пакт-
                                                        ются не более, чем раз каждая».
ной форме» [1], и, в общем случае, являются
                                                            Индекс цитирования, в узком смысле, позволяет
объектом     библиометрического    исследования.
                                                        судить о научной производительности автора и
Наблюдение за цитированием научных работ
                                                        является одним из показателей результативности
позволяет проследить за развитием той или иной
                                                        научной организации, алгоритм вычисления кото-
идеи во времени, за проникновением ее в смежные
                                                        рой определен Приказом Министерства образования
области. Д. Прайс, один из основоположников             и науки Российской Федерации от «14» октября
библиометрии, отметил, что цитирование образует         2009 г. № 406 об утверждении:
«сеть, связывающую все работы в единый комп-
                                                            «Типового положения о комиссии по оценке
лекс» [2]. Ю. Гарфилд, основатель Института
                                                        результативности деятельности научных организа-
                                                        ций, выполняющих научно-исследовательские,
Труды 14-й Всероссийской научной конференции            опытно-конструкторские и технологические работы
«Электронные библиотеки: перспективные методы и         гражданского назначения, и Типовой методики
технологии, электронные коллекции» — RCDL-2012,         оценки результативности деятельности научных
Переславль-Залесский, Россия, 15-18 октября 2012 г.     организаций, выполняющих научно-исследователь-




                                                   33
ские, опытно-конструкторские и технологические               Задача индексирования публикаций российских
работы гражданского назначения» [4].                      ученых и учет их цитирования в достаточно
     Составной частью методики оценки научной             представительном объеме, реализующий задачи
организации является пункт «Публикационная                Web of Science в отечественной среде, возложена на
активность» раздела «Научный потенциал и                  Российский индекс научного цитирования РИНЦ,
эффективность научных исследований». Для оценки           база данных которого доступна на платформе
публикационной активности методикой определя-             eLibrary.ru[13].
ется ряд показателей: количество публикаций,                 Целью РИНЦ является систематическое продви-
цитируемость по каждой публикации и импакт-               жение в сети Интернет российских научных изда-
фактор журнала, где опубликована работа. Учиты-           ний посредством реализации следующих задач:
ваются те журнальные статьи, которые зафик-                  - создание многоцелевой поисковой системы по
сированы в информационных ресурсах:                       публикациям российских ученых, включающей
   - реферативно-библиографическая база данных            статьи из научных журналов;
научного цитирования Web of Science, разра-                  - разработка механизмов и инструментария для
ботанная Институтом научной информации США;               статистического анализа отечественной науки;
   - Российский индекс научного цитирования                  - создание и формирование Единого реестра
(РИНЦ), функционирующий на платформе www.e-               публикаций российских ученых, авторитетную базу
library.ru                                                данных, представляющую максимально полную и
                                                          достоверную информацию о публикационном
                                                          потоке российских ученых, независимо от источ-
                                                          ника, времени, места и типа публикации;
2 Международные и отечественные                              - создание эффективной системы навигации в
                                                          массиве научной информации и обеспечение досту-
индексы цитирования                                       па российских пользователей к полным текстам
   На мировом рынке научной информации наибо-             публикаций через механизмы унифицированного
лее известны и широко представлены два междуна-           доступа;
родных индекса цитирования: Web of Science                   - доступность по сравнению с западными
компании T omson Reuters и Scopus компании                аналогами.
Elsevier. Оба эти проекта являются коммерческими,            Достоинства и недостатки каждой из этих
доступ к ним осуществляется на платной основе.            реферативных баз научного цитирования авторы
   База данных научного цитирования Web of                описали в своей статье [14]. Но именно индексы
Science (WOS) [6] является одним из продуктов,            цитирования WOS и РИНЦ, в соответствии с
входящим в состав информационно-поисковой                 Приказом Министерства образования и науки №406
системы компании Thomson Reuters ISI Web of               от 14 октября 2009 г, являются источником для
Knowledge [7]. WOS предоставляет исследователям           получения сведений о публикационной активности
и специалистам информацию по всем отраслям                научных работников.
знания среди свыше 12 000 журналов и 148 000                 В рамках исполнения данного Приказа по рас-
материалов конференций в области естественных,            поряжению Президиума Академии Наук России
общественных, гуманитарных наук и искусства.              была разработана и внедрена автоматизированная
   Индекс цитирования Scopus [8] разрабатывается          система учета результатов интеллектуальной
компанией Elsevier. Представляет собой крупней-           деятельности Российской академии наук.
шую в мире единую реферативную базу данных,
которая индексирует более 18000 наименований              3. Автоматизированная система учета
научно-технических и медицинских журналов                 результатов интеллектуальной деятель-
порядка 5000 международных издательств, а также,
в отличие от WOS, Интернет - источников. Scopus
                                                          ности Российской академии наук АСУ
обеспечивает программную поддержку в поиске               РИД
научных публикаций и предлагает ссылки на все                АСУ РИД РАН [15]– система, предназначенная
вышедшие рефераты из всего объема доступных               для автоматизации процессов учета результатов
статей.                                                   интеллектуальной деятельности Российской акаде-
   Для специалистов в области информатики                 мии наук.
определенный интерес представляют такие библио-              В данной статье не ставится задача полного
графические сервисы, как DBLP [9], ACM Digital            описания данной системы. Поэтому рассмотрим ту
Library [10], CiteSeerX [11], ориентированные на          ёё часть, которая относится к показателям
индексацию и учет цитирования публикаций по               публикационной активности. Поскольку сбор и
компьютерным технологиям, а также Google Scholar          предоставление статистики о публикационной
[12]. Но они «непрозрачны» в отношении того, как в        жизни научно-исследовательских институтов РАН
них собирается и обрабатывается библиографичес-           является обязательным ежегодным действием, то
кая информация. Поэтому нельзя поставить их в             дадим пояснения по некоторым показателям,
один ряд с вышеупомянутыми реферативными                  расшифровывающие их смысл и значение.
базами научного цитирования.




                                                     34
2.4.1. Число научных публикаций работников научной              взять импакт-факторы соответствующих журналов
организации, опубликованных в отчетном году                     за предыдущий отчетный год.
Пояснение. Данный показатель определяется                                  Ip = Сумма(nj*Ij) / N, j=1,m.
числом научных публикаций работников научной
организации за каждый год в любых научных                       Здесь
журналах, в тематических сборниках, в иных видах                   Ip - импакт-фактор публикаций работников
печатных изданий, а также на официальных                                научной организации в Web of Science;
интернет-сайтах признанных научных изданий.                       nj - количество опубликованных в отчетном году
Каждая публикация учитывается один раз для                              статей в j-ом журнале, зарегистрированном в
организации не зависимо от того, в скольких                             Web of Science;
изданиях она вышла и сколько соавторов                            Ij - импакт-фактор j-ого журнала в
участвовало в ее написании. Переводы статей не                          соответствующем году;
учитываются                                                       N - общее число статей, опубликованных научной
                                                                        организацией за отчетный год в журналах,
2.4.2. Число научных публикаций в зарубежных научно-
                                                                        индексируемых в Web of Science.
технических изданиях работников научной организации,
опубликованных в отчетном году                                  2.4.10. Число докладов, тезисов докладов, представленных
                                                                работниками научной организации на наиболее значимых
2.4.3. Число научных публикаций работников научной              конференциях, симпозиумах и чтениях
организации в отечественных изданиях, включённых в
перечень ВАК Минобрнауки России                                 2.4.11.   Количество    опубликованных     монографий,
                                                                учебников, научно-справочных изданий, словарей, атласов,
2.4.4. Число публикаций работников научной организации          энциклопедий и проч.
в Российском индексе научного цитирования (РИНЦ)
                                                                   Для автоматизации работы по генерации данных
2.4.5. Цитируемость работников научной организации в            показателей в ИПИ РАН разрабатывается про-
РИНЦ                                                            граммная система «Публикационная деятельность
                                                                (ПД)», целью которой является формирование
Пояснение. Данный показатель определяется
                                                                указанных показателей и создание комплексирован-
общим числом ссылок, появившихся в отчетном
                                                                ных индексов научного цитирования.
году, на все публикации работников научной
организации в РИНЦ
                                                                4. Цели и задачи программной системы
2.4.6. Число публикаций работников научной организации в
базе Web of Science
                                                                «Публикационная деятельность»
                                                                    Программная система предназначена для сбора,
2.4.7. Число публикаций работников научной организации          хранения и предоставления web-доступа к
других базах реферативной информации
                                                                информации, представляющей собой:
Пояснение. Данный показатель определяется                        - полные списки научных трудов авторов;
общим числом публикаций (научных статей)                         - списки цитирований научных трудов авторов;
работников научной организации в базах                              Дополнительно публикационная активность
реферативной информации, за исключением баз                     описывается:
РИНЦ и Web of Science.                                             - вычисляемым индексом Хирша автора;
                                                                   - импакт-факторы журналов, в которых публи-
2.4.8. Цитируемость работников научной организации в
указанных базах реферативной информации                              куется автор.
                                                                    Научными трудами являются журнальные
Пояснение. Данный показатель определяется                       статьи в отечественных и зарубежных изданиях,
общим числом ссылок, появившихся в отчетном                     монографии, учебники и учебные пособия, темы
году на все публикации работников научной                       НИР, объекты интеллектуальной собственности,
организации в реферативных базах (ВКЛЮЧАЯ                       диссертации, доклады и тезисы на конференциях
Web of Science и НЕ ВКЛЮЧАЯ РИНЦ).
2.4.9. Средний импакт-фактор публикаций      работников            Задача сбора и занесения в базу данных системы
научной организации в Web of Science                            «ПД» данных о публикациях автора является чисто
                                                                технической, на ней мы останавливаться не будем.
Пояснение. Для расчета данного показателя
                                                                Интерес вызывает проблема учета цитируемости
необходимо общее количество статей, опублико-
                                                                научных     публикаций.     Поскольку    создание
ванных в отчетном году в каждом журнале,
                                                                программной системы продиктовано Приказом
зарегистрированном в Web of Science, умножить на
                                                                министерства образования и науки, в котором
импакт-фактор соответствующих журналов в
                                                                указываются источники информации Web of Science
соответствующем году и сумму этих произведений
                                                                и РИНЦ на платформе eLIBRARY.ru, то, по
разделить на общее количество статей вышедших в
                                                                определению, данные о цитированиях научных
отчетном году.
                                                                статей должны браться из этих источников. Но
Если данные об импакт-факторах журналов за
                                                                вопрос получения данных цитирования из
отчетный год еще не опубликованы, то следует
                                                                предоставляемых отчетов eLIBRARY.ru является




                                                           35
нетривиальным. По ряду причин статистические             Введем определения классов для предлагаемой
отчеты данного ресурса представляют списки               модели базы данных.
публикаций и их цитирований в двух видах:                SpecializedDataEntity – класс, экземплярами
привязанные и непривязанные. Идеологи и разра-           которого являются научные публикации. Значений
ботчики eLIBRARY.ru признаются, что «привязан-           однородных свойств объекта «публикация»,
ные» публикация не формируют полного списка              которые являются экземплярами других классов,
публикаций автора, хранящихся в базе данных              сгруппированы в классы Facet1, …, Facetn .
данного ресурса. И уж, тем более, не охватывают          Определение 1. Множество
весь объем публикационной работы автора. Суще-                                               i
                                                                            X ={ X j | i =0, …n, j =1, …, ni },
ственная часть публикаций авторов оказывается в
списках «непривязанных» публикаций, и как                где индекс i определяет номер класса, j определяет
следствие, полные списки цитирований автора              номер экземпляра данного класса, определяется
должны извлекаться из той части системы, которая         множество всех       ИО.    Примем      следующее
позиционируется разработчиками РИНЦ как                  обозначение:
                                                           o
«непривязанная».                                         X m - экземпляры класса SpecializedDataEntity ,
   Таким образом, перед авторами статьи, которые                  m= 1, …, m0 , m0 - количество экземпляров
участвуют в разработке программной системы                        данного класса;
«Публикационная деятельность», стоит задача                f
извлечения и объединения данных о списках                X k - экземпляры классов Facetf,
публикаций и их цитирования из различных                          f=1, …, n, k = 1, …, kf , kf – количество
источников, имеющих разную природу и принципы                     экземпляров соответствующего класса.
организации. Объединение данных не может быть            Определение 2. Двуместный предикат S(X m , X k )
                                                                                                                             o       f
формальным суммированием, а требует комплекс-
                                                                                                             o                   f
ной обработки, в частности, для получения                обозначает, что объект X m имеет свойство X k , где
комплексированных индексов цитирования.                  m  {1, … m0}, f  { 1, …., n}, k  {1, …, kf }.
   На первом этапе для решения данной задачи                Как выше было сказано, для представленной
необходимо разработать концептуальную модель             модели значением свойства объекта является объект
базы данных, чтобы определить все информации-            другого класса, с которым установлено отношение
онные объекты и принципы построения связей               данного объекта.
между ними.                                                                                                      o       f
                                                         Определим множество S /= { S(X m , X k ) } для
5 Концептуальная модель базы данных                      таких
                                                         m  {1, … m0 }, f  { 1, …., n} , k  {1, …, kf },
   Для построения концептуальной модели в                                                    o       f
данной статье применяются принципы объектно-             для которых S(X m , X k ) = true - множество свойств
ориентированного программирования, при которых           всех ИО представленной модели предметной
традиционно используются два вида организации            области.
данных: классы и типы.                                   Поскольку понятия «бинарное отношение» и
   Типы данных являются спецификациями струк-            «признак (свойство)» идентичны в случае, если
туры и поведения информационных объектов (ИО).           значением свойства является объект другого класса,
   Классы специфицируют множество однотипных             то определим набор свойств объектов классов
объектов. Каждому классу сопоставляется тип,             Facetf, f=1, …, n, k = 1, …, kf, следующим образом.
описывающий структуру экземпляров класса.                Определение 3. Двуместный предикат
   В данной статье для описания типов и классов                         f                f
                                                         R 2f1 f 2 ( X i1 1 , X i 22 ) обозначает бинарное отношение
используются принципы фасетной классификации.
Типы информационных объектов, используя                                                      f           f
                                                         двух объектов X i1 1 и X i 22 ,
методы, базирующихся на фасетной классификации
                                                                f            f
и ранее разработанных авторами [16], представим в        где X i1 1 , X i 22 - объекты классов Facet f и Facet f ,
                                                                                                                     1               2
виде фасетной формулы объектов (ФФО) [17].
ФФО представлены в виде множества совокуп-               f1  f 2 ,           i 1  {1, …, kf 1 }, i2  {1, … , kf 2 }, kf 1 ,
ностей: <фасетный признак : список значений> для         kf 2 - количество объектов соответствующего клас-
всех ИО. ФФО являются аксиомами для
предлагаемой концептуальной модели.                      са, и принимает значение из множества {true, false}
   Использование фасетного подхода позволяет             в соответствии со следующими условиями:
                                                           2            f            f
унифицировать «три пространства спецификаций:            R f1 f 2 ( X i1 1 , X i 22 ) принимает значение true ,
агрегация (структура объектов), обобщение/спе-
циализация и классификация» [18].                        если      объект X m (экземпляр класса             o

   При спецификации типов данных мы принимаем            SpecializedDataEntity, m=1,…, m0) такой, что
во внимание, что значением свойств объектов
одного класса являются объекты других классов.
                                                          S (X om , X if1 1 )  S / и  S (X om , X if22 )  S /
                                                                    2            f               f
                                                         иначе R f (X i1 1 , X i 22 ) принимает значение false.




                                                    36
Определим множество                                                                                     объектов инварианта к выбору пути выстраивания
S//                   f        f
      = { R 2f f ( X i1 1 , X i 22 ) для таких f 1 , f 2 , i1, i2 , для                                 цепочки связей.
              1 2

                                               f            f
которых R 2f f ( X i1 1 , X i 22 ) =true} - множество                                                   6 Спецификация концептуальной
                       1 2

свойств объектов классов Facetf, f=1, …, n, k = 1, …,                                                   модели
kf,
    Таким образом, S = S/  S// - множество свойств                                                     6.1 Классы объектов
объектов представленное модели.                                                                            Для поставленной задачи          зафиксированы
    Множество свойств S является исходными                                                              следующие классы объектов:
данными для построения N-арных отношений
объектов разных классов. Собственно, построение                                                            1. Список авторов
отношений и есть основная тема данного раздела.                                                            2. Автор
N- арные отношения (предикаты), связывающие три                                                            3. Публикация
и более объектов разных классов Facetf, f=1, …, n ,                                                        4. Издание
определяются рекурсивно.                                                                                   5. Признак индексации в реферативных базах
Определение 4. Трехместный предикат                                                                     индекса цитирования
R f1 f 2 f 3 (X i1 1 , X i22 , X i33 ), где f1, f2, f3  {1, …, n},
    3              f               f               f                                                       6. Тип публикации
                                                                                                           7. Литература
i1  {1, …, k f1 }, i2  {1, … , k f 2 } , i3  {1,… , k f 3 },                                            8. Организация
                                                                                                           9. Отдел
k f1 , k f 2 , k f 3 -количество объектов соответству-
                                                                                                           10. Должность
ющего класса, выражающий отношение                                                         трех            11. Ученая степень
объектов, принимает значение true,                                                                         12. Ученое звание
если R 2f1 f 2 ( X i1 1 , X i 22 ) = true и  объект X i33 такой,                                          13. Направления научной деятельности ИПИ
                           f                   f                                       f

                                                                                                        РАН
          2            f                   f
что R f1 f 3 (X i1 1 , X i33 ) = true и                                                                    14. Тематика
                               f
                                                                                                           15. Период времени
      2            f
R f 2 f 3 (X i 22 , X i33 ) = true,                                                                        16. Объект связывания «Автор-Публикация»
               3                       f               f            f                                      17. Объект       связывания     «Публикация-
иначе R f1 f 2 f 3 (X i1 1 , X i22 , X i33 ) принимает значение                                         Публикация»
false .                                                                                                    Для задачи, рассматриваемой в данной статье,
Определение                                5.               N-местный                  предикат         интерес представляет частный случай механизма
  N                  f          f
R f1 f 2 ... f N (X i1 1 ,…, X i NN ), где f1, f2, …, fN                             {1, …, n},        построения связи объектов, а именно, метод
                                                                                                        выявления связей между цитирующей и цитируемой
i1  {1, …, k f1 }, i2  {1, … , k f 2 },…, iN  {1,…,k f N },                                          публикацией. При занесении новой публикации в
                                                                                                        базу данных в фоновом режиме запускается про-
k f1 ,        k f2 ,           …,                  k fN -           количество         объектов         грамма, реализующая метод построения отношений
соответствующего класса, выражающий отношение                                                           объектов. Выявленные связи сохраняются в
N объектов,   принимает значение true,                                                                  таблицах связи и служат в дальнейшем данными
                                                                                                        для формирования статистических отчетов.
если R f1 ... f N 1 (X i1 1 ,… , X iNN11 ) = true и  объект
              N 1                     f                        f


X i NN такой, что для  X i j , j  {1, … N-1}
      f                                                             fj
                                                                                                        6.2 Построение связей между цитируемой и
               2                                   fj      f                                            цитирующей публикациями
справедливо: R f j f N                         (X i j , X i NN           ) = true
        N                   f          f                                                                   Рассмотрим специальное подмножество всех
иначе R f1 f 2 ... f N ( X i1 1 ,…, X i NN ) принимает значение
                                                                                                        отношений, а именно отношения цитируемая –
false.                                                                                                  цитирующая публикация.
                                                                                                           Введем обозначения:
   Таким образом, множество R = { Rk | k=1, … ,n} -
                                                                                                        X m публикация с индексом m, где m  {1, … m0} ,
                                                                                                          0
множество k-местных предикатов, принимающих
значение true и выражающих отношения между                                                              m0 - общее количество публикаций.
                                                                                                         0                        0                     0
объектами представленной модели предметной                                                              C k - свойство объекта X m , обозначает, что X m
области.
                                                                                                        ссылается на объект X k , k  {1, … m0}
                                                                                                                              0
   Модель, базирующаяся на принципах фасетной
классификации, позволяет строить связи между                                                             0
                                                                                                        R m -свойство объекта, обозначает, что на объект с
объектами по произвольно выбранному сценарию,
                                                                                                                                                  0
причем последовательность их выбора не должна                                                           данным свойством есть ссылка от объекта X m
отражаться как на разработке программной под-
держки, так и для организации пользовательского
интерфейса. Программа поддержки взаимосвязей




                                                                                                   37
                             0    0
Аксиома. Если S(X m , C k ) =true, т.е. для публи-
                                                                       7.2 Реализационная модель
             0                                           0
кации X k определена ссылка на публикацию X k ,                        Создание макета реализационный модели авторы
то
         0
     S(X k       ,
                      0
                     Rm)   = true, т.е. для публикации
                                                              0
                                                             Xk        предполагают завершить к сентябрю 2012 г.
                                                                       Используемые программные средства:
                                              0
существует цитирующая публикация X m                                     - среда разработки web-приложений Yii PHP
                                                                            framework (Yiiframework 1.1.10) [19];
                                                                         - язык разработки PHP 5.3.13 [20]
7 Программная реализация                                                 - веб-сервер: Apache HTTP Server 2.2.22 [21]
                                                                         - СУБД: SQLite DB 3.7.12 [22]
7.1 Задачи программной системы
   Создание программной системы индексации
публикаций сотрудников ИПИ РАН «Публикаци-
онная деятельность» позволит обеспечить полноту
наполнения базы данных с учетом всех авторов и
полного списка публикаций, включающего не
только журнальные статьи, но и монографии, учеб-
ники, книги, патенты, доклады на конференциях..
Программная система реализуется в виде сервер-
ного приложения, которое выполняет следующие
функции:
     1. Поиск научных трудов:
  - по названию,
  - по автору, в том числе среди соавторов,
  - по соотнесению с направлением научных                              Рис. 1 Соотношение цитирований отечественных и
    исследований ИПИ РАН,                                              зарубежных источников
  - по соотнесению с тематиками фундаментальных
    исследований,
  - по году издания,                                                   7.3 Результаты статистической обработки
  - по подразделению, в котором работает автор                         библиографичесикх ссылок в статьях,
     2. Предоставление информации о публикаци-                         опубликованных в трудах конференции RCDL
онной активности сотрудников, включающей следу-                           Для тестирования разрабатываемой программ-
ющие сведения :                                                        мной системы «ПД» мы использовали материалы из
  - полные списки научных трудов автора;                               сборника трудов конференции «Электронные биб-
  - списки цитирований научных трудов автора;                          лиотеки: перспективные методы и технологии,
  - индекс Хирша автора;                                               электронные коллекции» — RCDL за последние 4
  - импакт-факторы журналов, в которых публи-                          года. Объектом интереса была статистика библио-
    куется автор.                                                      графических ссылок.
     3. Формирование статистических отчетов рас-
                                                                          Первые две группы, на которые были поделены
пределения научных трудов по направлениям науч-                        все ссылки на используемую литературу, состав-
ных исследований института, по тематикам, а также                      ляли ссылки на отечественные и зарубежные
по подразделениям и годам.
                                                                       источники. Диаграмма распределения ссылок по
                                                                       годам представлена на рисунке 1
                                                                  .




Рис. 2 Сводная статистика библиографических ссылок на материалы конференций.




                                                                  38
   Далее были проанализированы соотношения                 цитирования трудов, опубликованных в трудах
общего количества ссылок к цитированиям матери-            конференций, представлены на рисунке 2. Далее
алов конференций, из которых были выделены                 приведены более детализированные диаграммы по
ссылки на материалы трудов конференций RCDL.               каждому году для конференций, проведенных в
Особый интерес у нас вызывало соотношения                  городах Дубна, Петрозаводск, Казань и Воронеж.
самоцитирований и ссылок на работы других                  Соответствующие диаграммы представлены на
авторов, выступающих с докладами на конфе-                 рисунках 3-7.
ренции. Обобщенная по 4 годам диаграмма анализа




Рис. 3-7 Статистика библиографических ссылок на материалы конференций

Все цифры приведены в нижеследующей таблице.




                                                      39
Город             Число                                           Количество ссылок
                  работ    всего    на зарубежные   на отечественные     на труды           из них на RCDL    из них
                                    источники       источники            конференций                          самоцити
                                                                                                              рований
RCDL2008:         55       721      355             366                    201              49                30
Дубна
RCDL 2009:        39       498      311             187                    142              25                19
Петрозаводск
RCDL 2010:        80       1072 637                 435                    237              59                36
Казань
RCDL 2011:        55       705      417             288                    239              40                29
Воронеж

                                                             [3] Garfield, E. Science Citation Index-A New
Заключение                                                        Dimension in Indexing . “ Science”. May 8, 1664,
                                                                  Vol. 144, No. 3619, pp 649-6S4
   Создание программной системы индексации                   [4] Приказ Министерства образования и науки
публикаций сотрудников ИПИ РАН позволит                           Российской Федерации от « 14 » октября 2009 г.
обеспечить полноту наполнения базы данных с                       N 406 «Об утверждении типового положения о
точки зрения учета всех авторов и полного списка                  комиссии по оценке Результативности деятель-
публикаций, включающего не только журнальные                      ности научных организаций, выполняющих
статьи, но и доклады на конференциях, монографии,                 научно-исследовательские,         опытно-конструк-
учебники,       книги,       патенты.      Система                торские и технологические работы граждан-
администрирования предоставляет возможность                       ского назначения, и типовой методики оценки
постоянной актуализации списка работ и ссылок на                  результативности деятельности научных органи-
них,    используя    ресурсы     не   только    баз               заций, выполняющих научно-исследователь-
индексирования WoS и eLibrary, но и, к примеру,                   ские, опытно-конструкторские технологические
реферативную      базу    Scopus,   базу    данных                работы гражданского назначения». Зарегистри-
издательство Springer [23], Общероссийский                        рован в Минюст России от 28 января 2010 г. N
математический портал Math-Net.ru [24] и других                   16115. http://mon.gov.ru/
источников. Для актуализации БД можно                        [5] Hirsch, Jorge E., (2005) «An index to quantify an
использовать возможности поисковых систем                         individual’s scientific researc output». Retrieved
Google, Yandex. и т.д., но, правда, с учетом их                   from arXiv February 13, 2006.
неполной          достоверности,        требующей             [5] Eugene Garfield.//
дополнительной проверки.                                          http://www.garfield.library.upenn.edu/ )
   Программная система индексации публикаций                 [6]. Web of Science. //
сотрудников ИПИ РАН, с одной стороны,                             http://thomsonreuters.com/products_services/scienc
обеспечит сохранность и полное отражение                          e/ science_products /a-z/web_of_science
научных трудов Института в единой базе данных, с             [7] ISI Web of Knowledge
другой стороны, предоставит необходимые                           //http://isiwebofknowledge.com/
сведения      для     более     точной     оценки            [8] Scopus. Библиографическая и реферативная
публикационной активности каждого научного                   база данных и инструмент для отслеживания
сотрудника для сверки данных, формируемых, к                 цитируемости статей, опубликованных в научных
примеру, в отчетах РИНЦ. Дополнительно можно                 изданиях http://www.info.sciverse.com/scopus/
реализовать сервисы, целью которых является                  [9] DBLP http://www.informatik.unitrier.
оптимизация информационного обслуживания                     de/~ley/db/
сотрудников.                                                 [10] ACM Digital Library
                                                             http://portal.acm.org/dl.cfm
                                                             [11] CiteSeerX http://citeseerx.ist.psu.edu/
Литература                                                   [12] Google Scholar http://scholar.google.com/
                                                             [13] Российский индекс научного цитирования
 [1] Налимов       В.В.,     Мульченко      З.М.   Об
                                                                  РИНЦ www.elibrary.ru
     использовании статистических методов при
                                                             [14]Обухова О.Л., Заикин М.Ю., Соловьев И.В.
     управлении развитием науки //Управление,
                                                                  Предпосылки создания комплексированных
     планирование и организация научных и
                                                                  индексов цитирования сотрудников научного
     технических исследований. Т. 3. М.: ВИНИТИ,
                                                                  института //Труды 13-ой Всероссийской
     1970. С. 327-342
                                                                  научной конференции «Электронные библио-
[2] Derek J. de Solla Price. Networks of Scientific
                                                                  теки: перспективные методы и технологии,
     Papers. "Science", July 30, 1967, pp.510-515.
                                                                  электронные       коллекции»       -    RCDL’2011,
                                                                  Воронеж, Россия, 2011, стр. 207 – 215




                                                        40
[15] Автоматизированная система учета результатов           [22]SQL database engine. SQLite.
    интеллектуальной деятельности Российской                    http://www.sqlite.org/
    академии наук АСУ РИД http://asurid.ru                  [23]Издательство Springer.
[16] Обухова О.Л., Соловьев И.В., Бирюкова                      http://www.springerlink.com/
Т.К., Гершкович М.М., Чочиа А.П. Модель фасет-              [24]Общероссийский математический портал
    ного информационного поиска в коллекции                     http://www.mathnet.ru/
    научных материалов.// ”Системы и средства
    информатики”, доп. выпуск, Москва, Наука,                  The Technology of Aggregated Science
    2009 стр. 163 – 174
                                                                    Citation Indexes Formation
[17] Обухова О.Л., Бирюкова Т.К., Гершкович М.М.,
    Соловьев И.В., Чочиа А.П. «Метод динамичес-                  Olga Obuhova, Maxim Zaikin, Ivan Soloviev
    кого создания связей между информационными
    объектами базы знаний» //Труды 11-ой Всерос-                The article analyzes the requirements for the indexes
    сийской научной конференции «Электронные                defined by the Order of Ministry of education and
    библиотеки: перспективные методы и техно-               Science No. 406 on October 14, 2009 according to
    логии, электронные коллекции» - RCDL’2009,              which the effectiveness of scientific institutes should be
    Петрозаводск, Россия, 2009, стр. 39 – 45                evaluated.
[18] R. Hull, R. King. Semantic database modelling:             The article also describes new technology of
    Survey, applications and research issues. // ACM        collection of data on scientific researchers publishing
    Computing Surveys. – Vol. 19, No. 3. – 1987.            activity which was developed as the basis of IPI RAN's
[19] PHP framework for developing Web 2.0                   data retrieval system.
    applications.                                               The statistics of citation in the proceeding of the
    http://www.yiiframework.com/download/                   Conference “Digital libraries: advanced met od and
[20]Sripting language for Web development.                  tec nologies, digital collections” (RCDL) is given as
    http://php.net/                                         one of the results of the technology application.
[21]The Apache HTTP Server Project .                            .
    https://httpd.apache.org/




                                                       41