РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва http://library.hse.ru pislyakov@hse.ru SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005 Ресурсы, включенные в статистику использования-2004 EBSCOhost: JSTOR: ProQuest: ScienceDirect: Academic Search Premier Business Source Premier HealthSource MasterFILE Premier Newspaper Source Arts & Sciences I Arts & Sciences II Business Collection Language & Literature Collection ABI/INFORM Global Academic Research Library ProQuest Computing ProQuest Education Complete ProQuest Psychology Journals Social Science Plus Business, Management and Accounting Economics, Econometrics and Finance Social Sciences Электронные журналы: статистика использования в ГУ-ВШЭ, 2004 г. число полнотекстовых изданий изданий, к полным текстам которых были обращения доля востребованных изданий EBSCO 11000 1105 10% JSTOR 410 306 75% ProQuest 3700 1452 39% ScienceDirect 310 236 76% всего 13400 2592 19% Электронные журналы: статистика использования в ГУ-ВШЭ, 2004 г. открыто полнотекстовых статей EBSCO 6374 JSTOR 17534 ProQuest 10333 ScienceDirect 7719 всего 41960 Статистика использования эл. журналов: представление Закон Брэдфорда: формулировка Bradford S. C. Documentation. London: Crosley Lockwood, 1948 (Washington: Public Affairs Press, 1950). Lawani S. M. Bradford’s Law and the Literature of agriculture // International Library Review. 1973. Vol. 5. P. 341–350. Bradford S. C. Sources of information on specific subjects // Engineering. 1934. Vol. 137. P. 85–86. 429 статей в 9 журналах 499 статей в 59 журналах 404 статьи в 258 журналах Закон Брэдфорда: проверка на статистике ГУ-ВШЭ 26 журналов — 13987 статей 139 журналов — 13975 статей 2427 журналов — 13998 статей 3,5 33 журнала 139 : 26 = 5,3 в «ядре» 2427 : 139 = 17,5 Закон Брэдфорда: проверка на статистике ГУ-ВШЭ 4,36 78 журналов в «ядре» y = –159x3 + 2081x2 – 1461x + 2332 y'' = – 954x + 4162 y'' = 0 при x = 4,36 Ядро из 78-ми журналов: анализ по базам данных число полнотекстовых изданий изданий из ядра ГУ-ВШЭ изданий из ядра, читаемых только из данного ресурса EBSCO 11000 48 2 JSTOR 410 46 2 ProQuest 3700 46 2 ScienceDirect 310 17 17 Закон Леймкулера: формулировка Leimkuhler F. F. The Bradford Distribution // Journal of Documentation. 1967. Vol. 23. P. 197–207. Y = A ln(1 + BN) 42000 статьи Y — число статей в N наиболее продуктивных журналах; A и B — некоторые коэффициенты Для нормированных величин: Y = ln(1 + βx) / ln(1 + β) 0 1 журналы 2500 кривая Леймкулера: доля статей Y — доля от общего числа статей в доле x наиболее продуктивных журналов; β — «коэффициент концентрации» 0 доля журналов 1 Закон Леймкулера: проверка на статистике ГУ-ВШЭ β 5860 Используем нелинейную регрессию и Найдем площадь под кривой пытаемся, подбирая коэффициент β, исходные данные Леймкулера: приблизить наш график кривой, которая нелинейная регрессия подчиняется закону Леймкулера. S = Y(x) dx = = [ln(1 + βx) / ln(1 + β)] dx = = 1 + 1/β – 1/ln(β+1) S(β) возрастающая функция и S(β0) 0,5 S(β) 1 Для нашего случая S(5860) = 0,885. Закон Лотки: формулировка Lotka A. J. The Frequency Distribution of Scientific Productivity // Journal of the Washington Academy of Sciences. 1926. Vol. 16. P. 317–323. n=A/ xa , a2 ученые n — количество учёных, опубликовавших x статей; A — некоторый коэффициент В логарифмическом виде: ln n = – a ln x + K статьи ln (ученые) ln (статьи) Закон Лотки: проверка на статистике ГУ-ВШЭ Приложение закона к статистике использования электронных ресурсов: Найдем, из скольких журналов n было прочитано пользователями ровно x статей. нескорректированные данные скорректированные данные Закон Лотки выполняется, причем ln (журналов) a = 1,7 n = A / x a = A / x 1,7 ln (статей) Закон Ципфа: формулировка Zipf G. K. The Psycho-biology of Language. Boston: Houghton, 1935. Zipf G. K. Human Behaviour and the Principle of Least Effort. Reading: Addison-Wesley, 1949. r x f = const r — порядковый номер слова (в порядке убывания частоты); f — количество употреблений слова В обобщенном виде: a ln r + ln f = const, a 1 (обычно закон Ципфа плохо выполняется для верхних позиций рейтинга слов) Закон Ципфа: проверка на статистике ГУ-ВШЭ Приложение закона к статистике использования электронных ресурсов: Найдем зависимость между рангом журнала в упорядоченном списке востребованности изданий и количеством прочитанных из него статей. ln (статей) Закон Ципфа выполняется удовлетворительно и ln (место в рейтинге) a = 1,3 f x r 1,3 = const Принцип Парето, кривая Лоренца, индекс Джини — беднейшие 20% населения получают 7% общего Pareto V. Cours d’Économie Politique. Vol. 2. национального дохода Lausanne: 1 Université de Lausanne, 1897. — беднейшие 40% населения Lorenz M. O. Methods of measuring the concentration получают 18% общего национального дохода of wealth // Publications of the American Statisical Association. 1905. Vol. 9. P. 209–219 — беднейшие 60% населения «Plot along one axis cumulated percents of the population from получают 32% общего poorest to richest, and along the other the percent of the total wealth национального дохода held by these percents» (p. 217) — беднейшие 80% населения получают 52%C. общего Gini Variabilità e mutabilità // Memori di национального дохода Statistica. Vol. 1. Rome, 1912. P. 211–382. Metodologia — беднейшие 100% населения (т.е. всё население) получают 100% общего национального дохода (весь доход) Кривая Лоренца–Леймкулера Принцип Парето: проверка на статистике ГУ-ВШЭ Приложение закона к статистике использования электронных ресурсов: на 20% электронных журналов приходится 80% всех загрузок полнотекстовых статей процент журналов, содержащих 80% загруженных статей EBSCO + ProQuest + ScienceDirect 28% 18% 31% 25% 27% 22% все ресурсы совокупно 14,7% EBSCO JSTOR ProQuest ScienceDirect EBSCO + ProQuest Кривая Лоренца-Леймкулера и индекс Джини по статистике ГУ-ВШЭ % прочитанных статей Sобщ = 0,902 Sобщ G= (Sобщ – 0,5) : 0,5 = 0,8 % журналов Библиография Bookstein A. Informetric Distributions, part I: Unified Overview // Journal of the American Society for Information Science. 1990. Vol. 41. P. 368–375. Garfield E. Bradford’s Law and Realted Statistical Patterns // Current Contents. 1980. No. 19, 12 May. Egghe L. Type/Token-Taken Informetrics // Journal of the American Society for Information Science and Technology. 2003. Vol. 54. P. 603–610. Egghe L., Rousseau R. A proposal to define a core of a scientific subject: A definition using concentration and fuzzy sets // Scientometrics. 2002. Vol. 54. No. 1. P. 51–62. Burrell Q. Defining a core: Theoretical observations on the EggheRousseau proposal // Scientometrics. 2003. Vol. 57. No. 1. P. 75–92. РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва http://library.hse.ru pislyakov@hse.ru SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005