статей - eLIBRARY.LT

advertisement
РАСПРЕДЕЛЕНИЕ БРЭДФОРДА
И ПОДОБНЫЕ ЕМУ
ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ
на примере статистики использования
электронных ресурсов в университетской библиотеке
Владимир Владимирович Писляков
нач. отдела информационных систем
и электронных ресурсов библиотеки ГУ-ВШЭ, Москва
http://library.hse.ru
pislyakov@hse.ru
SCIENCE ONLINE: электронные информационные ресурсы для науки и образования
Турция, 2005
Ресурсы, включенные в статистику использования-2004
EBSCOhost:
JSTOR:
ProQuest:
ScienceDirect:
Academic Search Premier
Business Source Premier
HealthSource
MasterFILE Premier
Newspaper Source
Arts & Sciences I
Arts & Sciences II
Business Collection
Language & Literature Collection
ABI/INFORM Global
Academic Research Library
ProQuest Computing
ProQuest Education Complete
ProQuest Psychology Journals
Social Science Plus
Business, Management and Accounting
Economics, Econometrics and Finance
Social Sciences
Электронные журналы:
статистика использования в ГУ-ВШЭ, 2004 г.
число
полнотекстовых
изданий
изданий, к полным
текстам которых
были обращения
доля
востребованных
изданий
EBSCO
11000
1105
10%
JSTOR
410
306
75%
ProQuest
3700
1452
39%
ScienceDirect
310
236
76%
всего
13400
2592
19%
Электронные журналы:
статистика использования в ГУ-ВШЭ, 2004 г.
открыто
полнотекстовых
статей
EBSCO
6374
JSTOR
17534
ProQuest
10333
ScienceDirect
7719
всего
41960
Статистика использования эл. журналов: представление
Закон Брэдфорда: формулировка
Bradford S. C. Documentation. London:
Crosley Lockwood, 1948 (Washington:
Public Affairs Press, 1950).
Lawani S. M. Bradford’s Law and the Literature of
agriculture // International Library Review. 1973. Vol. 5.
P. 341–350.
Bradford S. C. Sources of information on
specific subjects // Engineering. 1934. Vol.
137. P. 85–86.
429 статей
в 9 журналах
499 статей
в 59 журналах
404 статьи
в 258 журналах
Закон Брэдфорда: проверка на статистике ГУ-ВШЭ
26 журналов
— 13987 статей
139 журналов
— 13975 статей
2427 журналов
— 13998 статей
 3,5
 33 журнала
139 : 26
= 5,3
в «ядре»
2427 : 139 = 17,5
Закон Брэдфорда: проверка на статистике ГУ-ВШЭ
 4,36  78 журналов
в «ядре»
y = –159x3 + 2081x2 – 1461x + 2332
y'' = – 954x + 4162
y'' = 0 при x = 4,36
Ядро из 78-ми журналов: анализ по базам данных
число
полнотекстовых
изданий
изданий из ядра
ГУ-ВШЭ
изданий из ядра,
читаемых только из
данного ресурса
EBSCO
11000
48
2
JSTOR
410
46
2
ProQuest
3700
46
2
ScienceDirect
310
17
17
Закон Леймкулера: формулировка
Leimkuhler F. F. The Bradford
Distribution // Journal of Documentation.
1967. Vol. 23. P. 197–207.
Y = A ln(1 + BN)
42000
статьи
Y — число статей в N наиболее
продуктивных журналах;
A и B — некоторые коэффициенты
Для нормированных величин:
Y = ln(1 + βx) / ln(1 + β)
0
1
журналы
2500
кривая Леймкулера:
доля
статей
Y — доля от общего числа статей в доле x
наиболее продуктивных журналов;
β — «коэффициент концентрации»
0
доля
журналов
1
Закон Леймкулера: проверка на статистике ГУ-ВШЭ
β  5860
Используем нелинейную регрессию и
Найдем площадь под кривой
пытаемся, подбирая коэффициент β,
исходные данные
Леймкулера:
приблизить наш график кривой, которая
нелинейная регрессия
подчиняется закону Леймкулера. S =  Y(x) dx =
=  [ln(1 + βx) / ln(1 + β)] dx =
= 1 + 1/β – 1/ln(β+1)
S(β) возрастающая функция и
S(β0)  0,5
S(β)  1
Для нашего случая
S(5860) = 0,885.
Закон Лотки: формулировка
Lotka A. J. The Frequency Distribution of Scientific
Productivity // Journal of the Washington Academy of
Sciences. 1926. Vol. 16. P. 317–323.
n=A/
xa ,
a2
ученые
n — количество учёных,
опубликовавших x статей;
A — некоторый коэффициент
В логарифмическом виде:
ln n = – a ln x + K
статьи
ln (ученые)
ln (статьи)
Закон Лотки: проверка на статистике ГУ-ВШЭ
Приложение закона к статистике использования
электронных ресурсов: Найдем, из скольких
журналов n было прочитано пользователями ровно
x статей.
нескорректированные данные
скорректированные данные
Закон Лотки
выполняется, причем
ln (журналов)
a = 1,7
n = A / x a = A / x 1,7
ln (статей)
Закон Ципфа: формулировка
Zipf G. K. The Psycho-biology of
Language. Boston: Houghton, 1935.
Zipf G. K. Human Behaviour and the
Principle of Least Effort. Reading:
Addison-Wesley, 1949.
r x f = const
r — порядковый номер слова (в
порядке убывания частоты);
f — количество употреблений слова
В обобщенном виде:
a ln r + ln f = const, a  1
(обычно закон Ципфа плохо выполняется для верхних позиций рейтинга слов)
Закон Ципфа: проверка на статистике ГУ-ВШЭ
Приложение закона к статистике использования
электронных ресурсов: Найдем зависимость
между рангом журнала в упорядоченном списке
востребованности изданий и количеством
прочитанных из него статей.
ln (статей)
Закон Ципфа
выполняется
удовлетворительно и
ln (место в
рейтинге)
a = 1,3
f
x
r 1,3 = const
Принцип Парето, кривая Лоренца, индекс Джини
— беднейшие 20% населения
получают
7% общего
Pareto
V. Cours d’Économie Politique. Vol. 2.
национального дохода
Lausanne: 1 Université de Lausanne, 1897.
— беднейшие 40% населения
Lorenz
M. O. Methods of measuring the concentration
получают
18% общего
национального
дохода
of wealth
// Publications of the American Statisical
Association.
1905. Vol. 9. P. 209–219
— беднейшие
60% населения
«Plot
along
one axis cumulated percents of the population from
получают
32%
общего
poorest to
richest, and along the other the percent of the total wealth
национального
дохода
held by these percents» (p. 217)
— беднейшие 80% населения
получают
52%C.
общего
Gini
Variabilità e mutabilità // Memori di
национального
дохода Statistica. Vol. 1. Rome, 1912. P. 211–382.
Metodologia
— беднейшие 100% населения
(т.е. всё население) получают
100% общего национального
дохода (весь доход)
Кривая Лоренца–Леймкулера
Принцип Парето: проверка на статистике ГУ-ВШЭ
Приложение закона к статистике использования
электронных ресурсов: на 20% электронных
журналов приходится 80% всех загрузок
полнотекстовых статей
процент журналов, содержащих 80%
загруженных статей
EBSCO + ProQuest + ScienceDirect
28%
18%
31%
25%
27%
22%
все ресурсы совокупно
14,7%
EBSCO
JSTOR
ProQuest
ScienceDirect
EBSCO + ProQuest
Кривая Лоренца-Леймкулера и индекс Джини
по статистике ГУ-ВШЭ
% прочитанных
статей
Sобщ = 0,902
Sобщ
G= (Sобщ – 0,5) : 0,5
= 0,8
% журналов
Библиография
Bookstein A. Informetric Distributions, part I: Unified
Overview // Journal of the American Society for
Information Science. 1990. Vol. 41. P. 368–375.
Garfield E. Bradford’s Law and Realted Statistical
Patterns // Current Contents. 1980. No. 19, 12 May.
Egghe L. Type/Token-Taken Informetrics // Journal of the American
Society for Information Science and Technology. 2003. Vol. 54. P.
603–610.
Egghe L., Rousseau R. A proposal to define a core of a scientific
subject: A definition using concentration and fuzzy sets //
Scientometrics. 2002. Vol. 54. No. 1. P. 51–62.
Burrell Q. Defining a core: Theoretical observations on the EggheRousseau proposal // Scientometrics. 2003. Vol. 57. No. 1. P. 75–92.
РАСПРЕДЕЛЕНИЕ БРЭДФОРДА
И ПОДОБНЫЕ ЕМУ
ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ
на примере статистики использования
электронных ресурсов в университетской библиотеке
Владимир Владимирович Писляков
нач. отдела информационных систем
и электронных ресурсов библиотеки ГУ-ВШЭ, Москва
http://library.hse.ru
pislyakov@hse.ru
SCIENCE ONLINE: электронные информационные ресурсы для науки и образования
Турция, 2005
Download