O’ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI MUHAMMAD AL-XORAZMIY NOMIDAGI TOSHKENTAXBOROT TEXNOLOGIYALARI UNIVERSITETI QARSHI FILIALI “KOMPYUTER INJINIRINGI”FAKULTETI 5-BOSQICH KI14-19SIRTQI GURUH TALABASI Samadov Sherzodningning “Ma`lumotlarni intelektual tahlili” FANIDANTAYYORLAGAN Mustaqil ishi Bajardi: SAMADOV SH . Qabulqildi: RUSTAMOV SH Machine Translated by Google Ma'lumotlar qazib olish algoritmlarini parallel bajarish xususiyatlari H.N.Zaynidinov1 , BY. Qarshiev2 1Toshkent axborot texnologiyalari universiteti, Toshkent, O‘zbekiston 2Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Samarqand filiali, Samarqand, O‘zbekiston Izoh. Ushbu maqolada ma'lumotlar qazib olish algoritmlarini (DMA) parallel bajarish xususiyatlari ko'rib chiqiladi. So'nggi bir necha yil ichida hisoblash samaradorligining oshishi ham ko'p yadroli protsessorlarning rivojlanishi, ham klaster tizimlarining, shu jumladan "bulutli" tizimlarning keng tarqalishi bilan bog'liq. Biroq, zamonaviy dasturiy ta'minot apparat vositalaridan sezilarli darajada orqada qoladi va ko'pincha mavjud hisoblash resurslaridan samarasiz foydalanadi. Bu muammo, birinchi navbatda, hisoblash algoritmlarini parallellashtirish vazifasining murakkabligi bilan bog'liq. Afsuski, IAD algoritmlari bundan mustasno emas. Hozirgi vaqtda ushbu sohada etarlicha katta hajmdagi tadqiqotlar olib borilmoqda. IAD sohasida alohida yo'nalishlar aniqlangan (xorijiy adabiyotlarda bu soha DataMining deb ataladi): parallel IAD (ParallelDataMining) va taqsimlangan IAD (DistributedDataMining). Parallel IDA algoritmlari sohasidagi tadqiqotchilarning ko'p harakatlari individual tahlil algoritmlarini parallellashtirish va ularni yanada optimallashtirishga sarflanadi. Vaziyat bu harakatlar muayyan hisoblash muhiti asosida qo'llanilishi bilan yanada og'irlashadi va shuning uchun bunday yechim boshqa sharoitlarga o'tkazilganda u samarasiz bo'ladi. Ishda ma'lumotlar va vazifalar bo'ylab parallellashtirilganda ma'lumotlarni qazib olish algoritmlarining ishlashining o'ziga xos xususiyatlari, dispetcher bilan va dispetchersiz ma'lumotlarni qidirish algoritmining parallel ishlashi va parallel ma'lumotlarni qazib olish algoritmlarida filiallar o'rtasidagi o'zaro ta'sir jarayoni tahlil qilinadi va yoritiladi. Kalit so'zlar. Ma'lumotlarni qazib olish, parallel algoritmlar, asinxron va sinxron almashish, ma'lumotlarni parallellashtirish, vazifalarni parallellashtirish, parallel tarmoqlar, ip, ip dispetcheri, sinxron almashinuv, asinxron almashish, klaster tizimlari. algoritmlarni KIRISH Ma'lumotlarni qazib olish algoritmlari (DMA) katta ma'lumotlar to'plamidan bilimlarni olish uchun mo'ljallangan [1]. Shu bilan birga, olingan bilimlarning eng katta qiymati va ahamiyatsizligi hisoblash parallellashtirish. Afsuski, IAD algoritmlari bundan mustasno emas. Hozirgi vaqtda ushbu sohada etarlicha katta hajmdagi tadqiqotlar olib borilmoqda. IBP sohasida alohida yo'nalishlar aniqlangan: parallel IBP va taqsimlangan IBP [3]. katta miqdordagi ma'lumotlarni tahlil qilishda mumkin. Bu erda tahlilning quyidagi asosiy muammolarini hisobga olish kerak: unumdorlik - katta hajmlarni tahlil qilish (terabaytlarda o'lchanadi) katta hisoblash resurslarini talab qiladi va tahlilchi uchun nomaqbul vaqt ichida yakunlanishi mumkin; tarqatish ma'lumotlarning katta hajmi tufayli ma'lumotlarni saqlash taqsimlangan saqlashda amalga oshirilishi mumkin, bundan 1. MA'LUMOTLAR BO'YICHA VA TOPSHIRIQ BO'YICHA PARALLEL QILISHDA AKLI TAHLIL ALGORITMMINI ISHLATISH. tashqari, ma'lumotlarning tabiatiga ko'ra ular turli manbalarda saqlanishi mumkin. Ushbu ikkala muammoni IAD ning parallel va/ yoki taqsimlangan bajarilishi orqali hal qilish mumkin. Har qanday parallel algoritm bo'lishi kerak parallel bajaruvchi shoxlar aniq ajratilgan [4, 13]. Bunday filiallarni bajarishdan oldin, bir nechta filiallarning parallel ishlashiga imkon berish uchun tayyorgarlik bosqichlarini bajarish kerak: • filiallar tashkil etish; So'nggi bir necha yil ichida hisoblash samaradorligining oshishi ham ko'p yadroli protsessorlarning rivojlanishi, ham • ularni qayta ishlash uchun ma'lumotlar, algoritmni bajarish parametrlari va modelning joriy holati bilan ishga tushirish; klaster tizimlarining, shu jumladan "bulutli" tizimlarning keng ta'minot apparat vositalaridan sezilarli darajada orqada qoladi va • algoritm tarmoqlarini ularning bajarilish vositalariga (iplar, aktyorlar, agentlar va boshqalar) ko'ra taqsimlash. ko'pincha mavjud hisoblash resurslaridan samarasiz foydalanadi. Bu muammo birinchi navbatda vazifaning murakkabligi parallellashtirishni ta'minlaydigan operatsiya qo'shiladi - bo'linish. bilan bog'liq. Parallel novdalar bajarilgandan so'ng, bitta natijani ta'minlaydigan tarqalishi bilan bog'liq [2, 13, 14]. Biroq, zamonaviy dasturiy Shu munosabat bilan, algoritm tuzilishiga bunday operatsiya bajarilishi kerak [5]. © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 83 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru • bajarilgan shoxchalarni sinxronlashtirish IAD algoritmlari uchun ikkinchi parallellashtirish usuli eng mos keladi, algoritm; Nima xuddi shu • natijalarni birlashtirish. hisobga olib, Buning uchun algoritm tuzilishiga qo'shish amali qo'shiladi. turli ma'lumotlarga nisbatan qo'llaniladi. Biroq, bu mumkin emas operatsiyalar vazifalarni parallellashtirishni istisno qiling. Algoritmlarni parallellashtirishning ikki turi mumkin [6]: Algoritmning har bir bosqichi (shu jumladan ma'lumotlarni ma'lumotlarga asoslangan va vazifaga asoslangan. Ma'lumotlarni tayyorlash) alohida protsessorda (kompyuterda) bajarilganda parallellashtirishda har bir filial turli xil ma'lumotlarga qo'llaniladigan parallelizmning quvur liniyasi modelidan foydalanish mumkin (1- bir xil qadamlar ketma-ketligini o'z ichiga oladi. Vazifalar bo'ylab rasm ). Bunday holda, ma'lumotlar manbadan qismlarga bo'linadi parallellashganda, filiallar bo'ladi va ularni qayta ishlash natijasi keyingi protsessorga o'tkaziladi. turli ketma-ketlikni o'z ichiga oladi qadamlar. Guruch. 1. Tahlil algoritmining quvur liniyasi modeli Ikkala holatda ham algoritm tuzilishiga ajratish va qo'shish amallari qo'shilishi kerak ( 2-rasm) [7]. Ma'lumotlarga asoslangan IDA algoritmini parallellashtirishda bo'linish operatsiyasi quyidagi Vazifalar bo'yicha IAD algoritmini parallellashtirganda, bo'linish operatsiyasi quyidagilarni bajarishi kerak: • parallel shoxchalar yaratish; • ularni amalga oshirish tartibini belgilash (ko'rsating amallarni bajaradi: har bir keyingi filialga havolalar); • algoritmning bir xil tarmoqlarini yaratish (asosiy tarmoqni klonlash); • ma'lumotlar to'plamiga, bajarish sozlamalariga va qurilayotgan bilim modeliga havolalarni birinchi filialga o'tkazish; • ma'lumotlar to'plamini taqsimlash, bajarish sozlamalari va har bir filial uchun qurilayotgan bilim modeli; • algoritmni bajarishni boshlash. Qo'shilish operatsiyasi zanjirdagi oxirgi filialdan barcha • maqsad filiallari aniq ijro etuvchisi; natijalarni olishi va ularni birlashtirishi kerak (mohiyatida, quvur liniyasidagi yakuniy operatsiyani bajarish). • bajarish uchun parallel shoxchalarni ishga tushirish. Ma'lumotlarni parallellashtirishda qo'shilish operatsiyasi iplarni sinxronlashtirishi va ular yaratgan bilim modellarini birlashtirishi kerak. © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 84 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru a b Guruch. 2. Algoritmlar tuzilmasida operatsiyalarni bo‘lish va qo‘shish (a – ma’lumotlar bo‘yicha parallellashtirishda, b – vazifalar bo‘yicha parallellashtirishda) mustaqil iplar bilan parallellashtirish va dispetcher ip bilan 2. ALGORITMNING PARALLEL ISHLATISHI DISPATCHER BILAN VA ISHLAB CHIQISHI AKLI TAHLIL Parallel algoritmlarni bo'ysunishiga qarab ham tasniflash mumkin parallellashtirish. Mustaqil iplar bilan parallellashtirishda algoritm shoxlarini (iplarni) parallel bajarish uchun barcha ishlov beruvchilar teng va mustaqildir. Ma'lumotlar va vazifalar parallelligi uchun bunday algoritmlarning tuzilishi rasmda keltirilgan . 3. parallel shoxlar [8]. Siz tanlashingiz mumkin Guruch. 3. Dispetcher ipi bilan parallel algoritm tuzilishi (a – ma’lumotlarni parallellashtirish uchun, b – vazifani parallellashtirish uchun) Parallel IDA algoritmining har bir mustaqil bo'limi bajarilishini boshlashdan oldin zarur bo'lgan hamma narsani olishi kerak: ma'lumotlar to'plami, bajarish sozlamalari va bilim modeli. Keyinchalik boshlashadi va tugashini kutishadi. Bu yuqorida aytib o'tilganidek, bo'linish operatsiyasi bilan amalga oshiriladi. Ishga tushgandan so'ng, har bir ip mustaqil ravishda ishlaydi. Tugatgandan keyin © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 85 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru barcha iplarning ishi qo'shilish bloki yordamida olingan natijalarni birlashtiradi. Dispetcher ipi bilan parallellashtirishning o'ziga xos xususiyati shundaki, qolgan iplarni boshqaradigan bitta etakchi ip ajratiladi. Boshqaruv, masalan, taqsimlashdan iborat bo'lishi mumkin 3. PARALLEL HAQIDA O'ARO TA'KSION Intellektual tahlil ALGORITMMLARI Ajratib turadigan yana bir xususiyat bir-biridan parallel algoritmlar hisoblanadi parallel tarmoqlar o'rtasida axborot almashinuvining mavjudligi yoki yo'qligi. Har qanday almashinuv ikki bosqichga bo'linadi: ÿ xabarni tayyorlash va jo'natish; bog'liq oqimlar orasidagi ma'lumotlar. Bunday algoritmning tuzilishi rasmda ko'rsatilgan . 3. Bo'lish va qo'shilish operatsiyalari o'rtasida asosiy tarmoq ajratiladi - - xabarni qabul qilish va qayta ishlash. Shunday qilib, parallel algoritmda xabarlarni jo'natish uchun dispetcher ipi. Ushbu tuzilma bilan dispetcher ipi qanday harakatlarni bajarishiga qarab, ajratish operatsiyasi ba'zi farqlarga ega bo'lishi mas'ul bo'lgan ikki turdagi operatsiyalar bajarilishi kerak: ÿ jo'natish – jo'natish, u xabarni tayyorlaydi va mavjud uzatish tashuvchisi orqali jo'natadi; mumkin. Masalan, u bajarilmaydi ma'lumotlarni taqsimlash, bajarish sozlamalari va ÿ qabul qilish – qabul qilish, xabarni kutish va mavjud xabar har bir filial uchun qurilayotgan bilim modeli, agar bu yetkazib berish vositalaridan foydalangan holda qabul qilish. funktsiya ip boshqaruvchisi tomonidan qabul qilingan bo'lsa. Har qanday holatda, bo'linish operatsiyasi amalga oshiriladi Yuborish operatsiyasining bajarilishi algoritmning umumiy dispetcher oqimini ishga tushirish va ishga tushirish. Bunday algoritm strukturasidagi qo'shilish operatsiyasi, oqimida sodir bo'ladi, ya'ni u oldingi blok tugagandan so'ng shuningdek, dispetcher ipining vazifalariga qarab, bajariladigan darhol bajariladi va u tugagandan so'ng (xabar jo'natiladi) harakatlar tarkibini o'zgartirishi mumkin. Shunday qilib, agar boshqaruv undan keyingi blokga o'tadi (1- rasm). 4). dispetcher ipi oraliq va yakuniy natijalarni birlashtirsa, u holda qo'shilish operatsiyasi faqat filiallarni sinxronlashtiradi va keyingi blokni boshlaydi. Boshlash Boshlash Split() … Split() … … Xabar Yuborish Kutish … Xabar Kutish yuboradi h Oling Oling … … Xabar Kutish … Yuborish qo'shilish() Oxiri Oling … … qo'shilish() a Oxiri b Guruch. 4. Parallel algoritm tuzilishidagi jo‘natuvchi va qabul qiluvchi bloklar: a – asinxron almashinuv, b – sinxron almashinuv © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 86 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru Yuboruvchidan farqli o'laroq, qabul qilish operatsiyasi xabar kelguncha kutadi, ya'ni oldingi blokni bajargandan so'ng, u bilim. Sozlamalar va ma'lumotlar qoladi algoritmlarni bajarishda o'zgarmaydi xabar qabul qilinmaguncha pauza qiladi. Qabul qilingan xabarni tahlil. Shunday qilib, o'rtasidagi almashinuv ishlash parallel ketma-ketliklar qayta ishlagandan so'ng, ketma-ketlik davom etadi. Ma'lumki, axborot yugurish Faqat bilim modeli funktsional bloklarga bo'ysunadi. almashinuvi asinxron va sinxron bo'lishi mumkin [9]. Asinxron shovqin bilan , xabar yuborilgandan so'ng, bajarish jarayoni davom etadi va javob istalgan vaqtda olinishi yoki umuman olinmasligi IAD algoritmlari xabar almashish vazifasiga duch keladigan quyidagi tipik vaziyatlarni ko'rib chiqaylik: mumkin (4-rasm, a). Sinxron bilan 1. parallel bajaruvchi shoxlar o'rtasida manba ma'lumotlarini taqsimlash algoritm; 2. ular uchun olingan bilim modellari to'plami almashish, jo'natuvchi xabar yuborgandan so'ng, javob olguncha yagona natijani birlashtirish va taqdim etish; kutish holatiga o'tadi (4-rasm, b). 3. keyingi tahlilni to'g'rilash uchun filiallar o'rtasida oraliq natijalarni (bilim modellari) almashish. IAD algoritmlarining individual funktsional bloklarining xatti-harakati quyidagilarga bog'liq: boshlang'ich ma'lumotlar, bilim modeli va blokga o'tkazilgan sozlamalar [10]. Bunday holda, blokni bajarish jarayonida faqat model o'zgarishi mumkin Birinchi holatda (5-rasm) jo'natuvchi blok ma'lumotlar to'plami vektorlarini taqsimlaydi parallel ishlaydigan iplar ichki algoritmga muvofiq. Boshlash Split() Yuborish Kutish Vektor Vektor Kutmoq hisoblanadi Oling Oling … … qo'shilish() Oxiri Guruch. 5. Algoritmning parallel bajaruvchi shoxlari o'rtasida manba ma'lumotlarini taqsimlash Ushbu blok dispetcher ipida bajarilishi kerak. Shu bilan birga, tegishli bo'lgan va shunga qarab tegishli filialga o'tkazadi qolgan oqimlar keyingisini olgandan keyin amalga oshiriladi vektor. Shunday qilib, tasvirlangan vaziyatda asinxron xabar almashinuvi qo'llaniladi. algoritm. Olingan natijalarni yig'ishda ( 6-rasm) har bir ip olingan natijalarni ip boshqaruvchisiga yuboradi, u ularni umumlashtiradi va bitta natijani taqdim etadi. Bunday holda, dispetcher ipi holatda Ta'riflangan vaziyatga misol Naive Base algoritmini parallellashtirishdir [11], bunda har bir parallel shoxcha sinf uchun Bayes ehtimolligini hammadan natija kutish hisoblaydi. Yuboruvchi blok, alohida bajaruvchi dispetcher ipi, ish zarralari va faqat barcha ish zarralaridan natijalar olganida, u ularni qayta ishlaydi. Bunday holda, asinxron xabar almashinuvi V ham sodir bo'ladi. keyingi vektor uchun k sinfini aniqlaydi © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 87 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru Boshlash Split() … … … Yuborish Yuborish Model Model Kutmoq hisoblanadi Oling qo'shilish() Oxiri 6- rasm. Olingan modellarni integratsiya qilish va yagona natijani taqdim etish uchun to'plash Yuqoridagi stsenariyning misoli Naive Base algoritmi bo'lishi Bunday holda, qabul qiluvchi yuborilgan xabarga javob kutmaydi, mumkin, unda: balki istalgan vaqtda boshqa ip tomonidan yuborilishi mumkin parallel ravishda ishlaydigan shoxlar, qurish bo'lgan ma'lumot (va birinchi ipdan xabar olishdan oldin). Bunday ularga o'tkazilgan vektorlarni qayta ishlashda alohida sinflar holda, ipning bajarilishi faqat qabul qilingandan keyin davom etadi uchun bilim modellari [12]. Barcha vektorlarni qayta ishlagandan so'ng, barcha filiallar o'zlari yaratgan bilim modellarini (har bir sinf dan hamma uchun) ip dispetcheriga uzatadilar. U bilim modellarini yagona oraliq natijalar natijaga birlashtiradi parallel iplar (shu jumladan o'zingizning natijangizni olganingizdan keyin). tahlil. Oraliq natijalar almashinuvi sharoitida (7-rasm) har bir ip Bu holatga misol sifatida tasniflash qoidalarini C4.5 [1] tuzish algoritmini keltirish mumkin, bunda har bir parallel bo'lim o'zi oraliq natijani hosil qilgandan so'ng, uni boshqa iplarga yuboradi. tomonidan aniqlangan ma'lumotlar to'plami asosida atributlarning Da axborot mazmunini hisoblab chiqadi. Bunday holda, atribut ma'lumotlari tarkibining hisoblangan qiymatlarini algoritm barcha oraliq oqimlardan qabul qilish tarmoqlari o'rtasida almashish mumkin. Axborotni olishni hisobga natijalar, har bir ip ularni qayta ishlaydi va bajarishni davom ettiradi. Shuni ta'kidlash kerakki, har bir oqimda bir qator olgan holda, har bir filial butun ma'lumotlar to'plami uchun eng informatsion atributniKaenyiiqnlaydi va bquanriohrilsaorbga olgan holda jo'natuvchi-qabul qiluvchi bloklari mavjudligiga qaramay, bu daraxtini quradi. almashinuv sinxron emas, chunki unda © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 88 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru Boshlash Split() … … yuboradi Yuborish Kutish Oling … Model Model h Yuborish Model Kutish Model Model Kutish Model Oling Oling … … … qo'shilish() Oxiri Guruch. 7. Keyingi tahlilni to'g'rilash uchun filiallar o'rtasida oraliq natijalar (bilim modellari) almashinuvi XULOSA Shunday qilib, IDA algoritmlarini parallel ravishda bajarishda quyidagilarni hisobga olish kerak: qismlarga ajratib olinadi va ularni qayta ishlash natijasi keyingi protsessorga o'tkaziladi. Parallelizatsiya bilan farqlash mumkin bilan mustaqil iplar va parallellashtirish dispetcher ipi. Mustaqil iplar bilan parallellashtirishda algoritm shoxlarini (iplarni) parallel bajarish uchun barcha ishlov beruvchilar ÿ ma’lumotlarga asoslangan algoritmlarni parallellashtirish va teng va mustaqildir. O'ziga xos xususiyat vazifa bo'yicha ÿ algoritmni dispetcher bilan parallellashtirish va dispetchersiz ÿ parallel algoritmlarda axborot almashish parallellashtirish bilan dispetcher ipi qolgan iplarni boshqaradigan bitta yetakchi ip ajratiladi. Boshqaruv, masalan, qaramlar o'rtasida ma'lumotlarni Ma'lumotlarni parallellashtirishda har bir filial bir xil ketmaketlikni o'z ichiga oladi turli ma'lumotlarga taalluqli qadamlar. Vazifalar bo'ylab parallellashganda, filiallar bo'ladi turli ketma-ketlikni o'z ichiga oladi qadamlar. Turli ma'lumotlarga bir xil operatsiyalarni qo'llashni ko'rib chiqsak, birinchi parallellashtirish usuli IDA algoritmlari uchun eng mos keladi degan xulosaga kelishimiz mumkin. Biroq, taqsimlashdan iborat bo'lishi mumkin oqimlar Axborot almashinuvi asinxron va sinxron bo'lishi mumkin. Asinxron aloqada, xabar yuborilgandan so'ng, bajarish jarayoni davom etadi va javob istalgan vaqtda olinishi yoki umuman bo'lmasligi mumkin. Sinxron almashinuvda jo'natuvchi xabar yuborib, javob olguncha kutish holatiga o'tadi. vazifalar bo'yicha parallelizatsiyani istisno qilib bo'lmaydi. Algoritmning har bir bosqichi alohida protsessorda bajarilganda parallelizmning quvur liniyasi modelidan foydalanish mumkin. Bunday holda, manbadan olingan ma'lumotlar ADABIYOT [1] Ma'lumotlar va jarayonlar tahlili: Darslik. universitetlar uchun qo'llanma. 3-nashr. / A. A. Barseghyan [va boshq.] - SanktPeterburg: BHV-Peterburg, 2009. - 512 p. © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 89 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru [2] M.S. Kupriyanov, I.I. Xolod, Z.A. Qarshiev, I.A. Golubev / Tarqalgan tizimlarda ma'lumotlarni qazib olish. Monografiya. – Sankt-Peterburg: Sankt-Peterburg elektrotexnika universiteti nashriyoti "LETI", 2012. 110 b. [3] Karpov V. E. Algoritm va dasturlarni parallellashtirishga kirish / V. E. Karpov // Kompyuter tadqiqotlari va modellashtirish. 2010 yil, - T. 2, No 3, - S. 231–272. [4] Mikov A. I., Zamyatina E. B. Tarqalgan tizimlar va algoritmlar: O'quv qo'llanma. nafaqa M.: BINOM. Bilimlar laboratoriyasi, 2007 yil. [5] Starichenko, B. E. Informatikaning nazariy asoslari: Universitetlar uchun darslik / B. E. Starichenko - 2-nashr. qayta ishlangan va qo'shimcha – M.: Ishonch telefoni Tele-com, 2003. – 312 b. [6] Stolyarov L.N., Abramov V.M. Informatika fanining boshlanishi. Vazifadan dasturga / L.N. Stolyarov, V.M. Abramov - M.: MAKET nashriyoti, 2007. - 120 b. [7] Karpov V. E. Algoritm va dasturlarni [14] H.N. Zaynidinov, G.O. Tojiboev, O.U. Mallaev. ko'p yadroli protsessorlarda seysmik signallar uchun parallel algoritmlarni qayta ishlash. Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2018 yil, No 1 (23), Novosibirsk, Rossiya, 89–95-betlar. [15] Hakimjon Zaynidinov, Akbarali Rasulov. Shaxsiy kompyuterlar klasterida parallel dasturni ishlab chiqish. Konvergentsiya axborot texnologiyalari jurnali (JCIT), jild. 9, ÿ 5, bet. 1-5, 2014, Janubiy Koreya. http://www.aicit.org/jcit/global/ppl.html? jname=JCIT Hakimjon Nasiridinovich Zaynidinov - shifokor texnik fanlar, professor, Toshkent universiteti axborot texnologiyalari kafedrasi parallellashtirishga kirish / V. E. Karpov // Kompyuter tadqiqotlari va modellashtirish. - mudiri 2010, – T. 2, 3-son, – B. 231–272. [8] Amol G., Prabhanjan K., Edvin P., Ramakrishnan K. NIMBLE: MapReduce-da parallel ma'lumotlar qazib olish va mashinani o'rganish algoritmlarini amalga oshirish uchun asboblar to'plami. Bilimlarni kashf qilish va ma'lumotlarni qazib olish bo'yicha 17-ACM SIGKDD xalqaro konferentsiyasi materiallari (KDD'11), San-Diego, Kaliforniya, AQSh, 21-24 avgust, 2011 yil. P. 334-342. [9] Amado N., Gama J., Silva F. Qaror daraxti induksiyasida parallellikdan foydalanish. Mashinani o'rganish uchun sayt Muhammad Xorazmiyning olish Elektron pochta: [email protected] Zaynidin Abduvalievich Qarshiev – fan nomzodi, parallel va taqsimlangan hisoblashda. Kavtat-Dubrovnik, Xorvatiya. 2003 yil. texnik [10] Andrade H., Kurc T., Saltz J., Sussman A. Umumiy xotira multiprotsessorlari klasterlarida ma'lumotlarni qazib olish uchun qaror daraxtini qurish. Yuqori samarali ma'lumotlarni qazib olish: keng tarqalgan va ma'lumotlar oqimini qazib olish bo'yicha 6-xalqaro seminarda (HPDM: PDS'03). shahar Toshkent filiali “Kompyuter tizimlari” kafedrasi dotsenti. Muhammad alXorazmiy nomidagi axborot San-Fransisko, CA. 2003 yil. [11] Caragea D. Taqsimlangan, semantik jihatdan heterojen, avtonom ma'lumotlar manbalaridan tasniflagichlarni o'rganish. Doktorlik dissertatsiyasi, Ayova shtati universiteti. 2004 yil. [12] Hall OL, Chawla N., Bowyer WK Taqsimlangan ma'lumotlardan o'rganish qoidalari. Katta o'lchamli parallel KDD tizimlari (KDD99) bo'yicha seminarda. Shuningdek, RPI, CS Dep. Tech. Hisobot 99-8. 1999. S. 77–83. [13] Samatova NF, Ostrouchov G., Al Geist, Melechko AV Rachet: Tarqatilgan ma'lumotlar to'plamlaridan klaster ierarxiyasini samarali qopqoq asosida birlashtirish. nomi axborot texnologiyalari. nomi texnologiyalari universiteti. E-mail: [email protected] m Qarshiev Zaynidin Abduvaliyevich Maqola 02/11/2020 olindi Tarqatish. Parallel ma'lumotlar bazalari, 11(2). 2002. B. 157–180. Ma'lumotlarni qazib olish algoritmlarini parallel bajarish xususiyatlari X.N. Zaynidinov1 , Z.A.Qarshiev2 1 Toshkent axborot texnologiyalari universiteti, Toshkent, O‘zbekiston 2Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Samarqand filiali, Samarqand, O‘zbekiston Abstrakt. Ushbu maqolada ma'lumotlar qazib olish algoritmlarini (IAD) parallel bajarish xususiyatlari ko'rib chiqiladi. So'nggi bir necha yil ichida kompyuter texnologiyalari samaradorligining oshishi ham ko'p yadroli protsessorlarning rivojlanishi, ham klaster tizimlarining, shu jumladan bulutli tizimlarning keng tarqalishi bilan bog'liq. Biroq, zamonaviy dasturiy ta'minot apparat vositalaridan sezilarli darajada orqada qoladi va ko'pincha taqdim etilgan hisoblash resurslaridan samarasiz foydalanadi. Bu muammo, birinchi navbatda, hisoblash algoritmlarini parallellashtirish vazifasining murakkabligi bilan bog'liq. Afsuski, IAD algoritmlari bundan mustasno emas. Hozirgi vaqtda ushbu sohada juda ko'p miqdordagi tadqiqotlar olib borilmoqda. IAD sohasidagi alohida yo'nalishlar ta'kidlangan (xorijiy adabiyotlarda bu soha DataMining deb ataladi): parallel IAD (ParallelDataMining) va taqsimlangan IAD © Automatics & Software Enginery. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 90 Machine Translated by Google © Avtomatlashtirish va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1(31) http://www.jurnal.nips.ru (DistributedDataMining). Parallel IAD algoritmlari sohasidagi tadqiqotchilarning ko'p harakatlari individual tahlil algoritmlarini parallellashtirish va ularni yanada optimallashtirishga sarflanadi. Vaziyat bu harakatlar ma'lum bir hisoblash muhiti asosida qo'llanilishi bilan yanada og'irlashadi va shuning uchun bunday yechim boshqa sharoitlarga o'tkazilganda u samarasiz bo'ladi. Maqolada ma'lumotlar va vazifalarni parallellashtirishda ma'lumotlarni qidirish algoritmlari ishlashining o'ziga xos xususiyatlari, dispetcher bilan va dispetchersiz ma'lumotlarni ta hlil qilish algoritmining parallel ishlashi va parallel ma'lumotlarni qazib olish algoritmlarida filiallar o'rtasidagi o'zaro ta'sir jarayoni tahlil qilinadi va yoritiladi. Kalit so'zlar. Ma'lumotlarni qidirish, parallel algoritmlar, asinxron va sinxron almashinuv, ma'lumotlarni parallellashtirish, vazifa parallellashtirish, parallel shoxchalar, ip, dispetcher ipi, sinxron almashinuv, asinxron almashinuv, klaster tizimlari. ADABIYOTLAR [1] Analiz dannykh i protsessov: Ucheb. posobiye dlya vuzov. 3nashr / AA Barsegyan [i dr.] – SPb.: BKHV-Peterburg, 2009. – 512 b. [2] Intellektual tahlil dannyx v raspredelennykh sistemax / MS Kupriyanov [i dr.] - SPb.: Izd-vo SPbGETU “LETI”, 2012. 110 s. [3] Karpov V. Ye. Vvedeniye v rasparallelivaniye algoritmov i programm / V. Ye. Karpov // Komp'yuternyye issledovaniya i modelrovaniye. 2010, – T. 2, ÿ 3, – S. 231–272. [4] Mikov A.I., Zamyatina Ye. B. Taqsimlangan tizimlar va algoritmlar: Ucheb. posobiye. M.: BINOM. Laboratoriya znaniy, 2007 yil. [5] Starichenko, B. Ye. Teoreticheskiye osnovy informatiki: Uchebnoye posobiye dlya vuzov / B. Ye. Starichenko - 2-nashr. pererab. men dopman. – M.: Goryachaya liniya - Tele-kom, 2003. – 312 s. [6] Stolyarov L.N., Abramov VM Nachala informatika. Zadachi k pro-grammasidan / LN Stolyarov, VM [12] Hall OL, Chawla N., Bowyer WK Taqsimlangan ma'lumotlardan o'rganish qoidalari. Katta o'lchamli parallel KDD tizimlari (KDD99) bo'yicha seminarda. Shuningdek, RPI, CS Dep. Tech. Hisobot 99-8. 1999. S. 77–83. [13] Samatova NF, Ostrouchov G., Al Geist, Melechko AV Rachet: Tarqatilgan ma'lumotlar to'plamlaridan klaster ierarxiyasini samarali qopqoq asosida birlashtirish. Tarqatish. Parallel ma'lumotlar bazalari, 11(2). 2002. B. 157–180. [14] X.N. Zaynidinov, G.O.Tojiboyev, O.U Mallayev. Parallel'nyye algoritmy obrabotki seysmicheskix signalov va mnohoyadernykh protsessorah. Avtomatika i programmnaya inzheneriya. 2018 yil, No 1 (23), g. Novosibirsk, Rossiya, S. 89–95. [15] Hakimjon Zaynidinov, Akbarali Rasulov. Shaxsiy kompyuterlar klasterida parallel dasturni ishlab chiqish. Konvergentsiya axborot texnologiyalari jurnali (JCIT), jild. 9, ÿ 5, b. 1-5, 2014, Janubiy Koreya. http://www.aicit.org/jcit/global/ppl.html?jname=JCIT Abramov – M.: Izd-vo MAKET, 2007. – 120 s. [7] Karpov V. Ye. Vvedeniye v rasparallelivaniye algoritmov i programm / V. Ye. Karpov // Komp'yuternyye issledovaniya i modelirovaniye. 2010, – T. 2, ÿ 3, – S. 231–272. Xakimjon Nasriddinovich Zaynidinov – texnika fanlari doktori, professor, Muhammad alXorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Axborot texnologiyalari kafedrasi mudiri. [8] NIMBLE: MapReduce’da parallel ma’lumotlar qazib olish va mashinani o‘rganish algoritmlarini amalga oshirish uchun asboblar to‘plami. Bilimlarni kashf etish va ma'lumotlarni qazib olish bo'yicha 17-ACM SIGKDD xalqaro konferentsiyasi materiallari (KDD'11), San-Diego, Kaliforniya, AQSh, 21-24 avgust, 2011 yil. P. 334342. Elektron pochta: [email protected] Zaynidin Abduvaliyevich Qarshiev – texnika fanlari nomzodi, Muhammad [9] Amado N., Gama J., Silva F. Qaror daraxti induksiyasida parallellikdan foydalanish. Mashinani o'rganish uchun parallel al-Xorazmiy nomidagi Toshkent va taqsimlangan hisoblashda. Kavtat-Dubrovnik, Xorvatiya. 2003 yil. axborot texnologiyalari universiteti Samarqand filiali “Kompyuter tizimlari” kafedrasi dotsenti.E-mail: [10] Andrade H., Kurc T., Saltz J., Sussman A. Umumiy xotira multiprotsessorlari klasterlarida ma'lumotlarni qazib olish uchun qaror daraxtini qurish. Yuqori samarali ma'lumotlarni qazib olish: keng tarqalgan va ma'lumotlar oqimini qazib olish bo'yicha 6-xalqaro seminarda (HPDM: PDS'03). San-Fransisko, CA. 2003 yil. [11] Caragea D. Taqsimlangan, semantik jihatdan heterojen, avtonom ma'lumotlar manbalaridan tasniflagichlarni o'rganish. Doktorlik dissertatsiyasi, Ayova shtati universiteti. 2004 yil. [email protected] Hujjat 11.02.2020 da qabul qilingan © Avtomatika va dasturiy ta'minot muhandisligi. 2020 yil, ÿ 1 (31) http://jurnal.nips.ru/en 91