ارائة چهارچوبی مبتنیبر جمعسپاری برای واکاوی تحلیلی مفاهیم قرآنی با استفاده از پردازش زبان طبیعی: راهکار تا محدودیتها

Article data in English (انگلیسی)
- Arief Fatchul, Huda, Huda Arief Fatchul, Fauziah None, Fauziah, Ratnawulan Elis, Ratnawulan Elis, Gumelar Dian Rachmat, and Gumelar Dian Rachmat (2021). Arabic Part Of Speech (POS) Tagging Analysis using Bee Colony Optimization (BCO) Algorithm on Quran Corpus. 7th International Conference on Wireless and Telematics (ICWT).
- Aslani, Akram and Mahdi Esmaeili (2018). Finding Frequent Patterns in Holy Quran UsingText Mining. Signal and Data Processing, (15), 89-100.
- Auhood, Alfaries, Alfaries Auhood, Al-Bahlal Manal, Al-Bahlal Manal, Almazrua Manal, Almazrua Manal, Almazrua Amal, and Almazrua Amal (2013). A Rule-Based Annotation System to Extract Tajweed Rules from Quran. Taibah University International Conference on Advances in Information Technology for the Holy Quran and Its Sciences.
- Bana, Alsharif, R. Tahboub, and L. Arafeh (2016). Arabic text to speech synthesis using Quran-based natural language processing module. Journal of Theoretical and Applied Information Technology, 83(1),148
- Damith, Premasiri, Ranasinghe Tharindu, W. Zaghouani, and R. Mitkov (2022). DTW at Quran QA 2022: Utilising Transfer Learning with Transformers for Question Answering in a Low-resource Domain, OSACT.
- Dardya, Putra, D. I. A. Putra, Yusuf Muhammad, Yusuf Mohd Ali Mohd, M. Yusuf, and M. Yusuf (2021). Proposing machine learning of Tafsir al-Quran: In search of objectivity with semantic analysis and Natural Language Processing, IOP Conference Series: Materials Science and Engineering.
- Ehsan, Khadangi, Khadangi Ehsan, Khadangi Ehsan, Fazeli Mohammad Moein, Fazeli Mohammad Moein, Shahmohammadi Amin, and Shahmohammadi Amin (2018). The Study on Quranic Surahs Topic Sameness Using NLP Techniques, International Conference on Computer and Knowledge Engineering.
- Ensaf Hussein, Mohamed, Mohamed Ensaf Hussein, H. El-Behaidy Wessam, and H. El-Behaidy Wessam (2021). An Ensemble Multi-label Themes-Based Classification for Holy Quran Verses Using Word2Vec Embedding, Arabian Journal for Science and Engineering.
- Hupkes, Dieuwke, Mario Giulianelli, Verna Dankers, Mikel Artetxe, Yanai Elazar, Tiago Pimentel, Christos Christodoulopoulos, Karim Lasri, Naomi Saphra, and Arabella Sinclair (2023). A taxonomy and review of generalization research in NLP. Nature Machine Intelligence, (5), 1161-74.
- Khadangi, Ehsan, Mohammad Moein Fazeli, and Mehdi Naghavi (2022). The Study on Quranic surahs Structured-ness and their Order Organization Using NLP Techniques, Journal of Interdisciplinary Quranic Studies (JIQS), 1.
- Mohamed Osman, Hegazi, Hegazi Mohamed Osman, Hilal Anwer Mustafa, Hilal Anwer, Alhawarat Mohammad, and Alhawarat Mohammad (2015). Fine-Grained Quran Dataset, International Journal of Advanced Computer Science and Applications.
- Mohammad, Alhawarat, and Alhawarat Mohammad (2015). Extracting Topics from the Holy Quran Using Generative Models, International Journal of Advanced Computer Science and Applications.
- Muhammad Huzaifa, Bashir, M. Azmi Aqil, Nawaz Haq, Zaghouani Wajdi, Diab Mona, Al‐Fuqaha Ala, and Qadir Junaid (2023). Author Correction: Arabic natural language processing for Quranic research: a systematic review, Artificial Intelligence Review.
- Nima, A. Al-Fakhry, and Al-Fakhry Nima (2020). The Linguistic Connotations of the Word Light in the Holy Quran (An analytical study of Quranic verses using Artificial intelligent techniques), Al-Rafidain Journal of Computer Sciences and Mathematics.
- Patil, Rajvardhan, Sorio Boit, Venkat Gudivada, and Jagadeesh Nandigam (2023). A survey of text representation and embedding techniques in nlp, IEEE Access.
- Shasha Arzila, Tarmizi, and Saad Saidah (2022). NAMED ENTITY RECOGNITION FOR QURANIC TEXT USING RULE BASED APPROACHES, Asia-Pacific Journal of Information Technology and Multimedia.
- Syamsu, Nahar, Daulay Nurul Sakinah, and M. Nazri (2023). Optimalisasi Menghafal Al-Quran: Penerapan Metode Neuro Linguistic Programming (NLP) di Pesantren Islamic Centre Sumut, Fikrotuna: Jurnal Pendidikan dan Manajemen Islam.
- Yasser, Shohoud and Shoman Maged (2023). Quranic Conversations: Developing a Semantic Search tool for the Quran using Arabic NLP Techniques, arXiv.org.
- Zineb, Touati-Hamad, Touati-Hamad Zineb, Laouar Mohamed Ridda, Laouar Mohamed Ridda, Bendib Issam, and Bendib Issam (2020). Quran content representation in NLP, International Conference on Information and Software Technologies.
- Zineb, Touati-Hamad, Laouar Mohamed Ridda, Bendib Issam, and Hakak Saqib (2022). Arabic Quran Verses Authentication Using Deep Learning and Word Embeddings, ˜The œinternational Arab journal of information technology.
ارائة چهارچوبي مبتنيبر جمعسپاري براي واکاوي تحليلي مفاهيم قرآني
با استفاده از پردازش زبان طبيعي: راهکار تا محدوديتها
سعيد عباسينيا / استاديار گروه الهيات و معارف اسلامي، علوم قرآن وحديث، دانشگاه آزاد اسلامي، واحد تهران غرب، تهران، ايران
دريافت: 15/11/1403 ـ پذيرش: 30/01/1404 dr.abasinya@iau.ac.ir
چکيده
استفاده از فنون پردازش زبان طبيعي (NLP) براي تجسم مفاهيم و معاني متن قرآن، نهتنها به پژوهشگران حوزة علوم قرآني کمک ميکند تا تحليلهاي قدرتمندتري براي انتقال مفاهيم اصيل اين متن الهي ارائه دهند، بلکه از نظر فرهنگي و علمي به فهم عميقتر و توسعة دانش و ارزشهاي اسلامي و معنوي جامعه کمک قابل توجهي ميکند. اين پژوهش يک چهارچوب راهبردي مبتنيبر جمعسپاري بهمنظور ارتباط ميان دو حوزة مهم «علوم قرآني» و «پردازش زبان طبيعي» براي تحليل عميق مفاهيم و معاني قرآن ارائه ميدهد. چهارچوب راهبردي پيشنهادي، راهکار تحليل معنايي متن قرآن براي استخراج مفاهيم و معاني عميقتر و ارتباطات معنايي بين عناصر مختلف آن را با استفاده از روشهاي پيشرفتة NLP ارائه ميکند و قابليتي را براي بررسي تفاوتها و تطابقهاي معاني و شناسايي الگوها و ارتباطات معنايي در قرآن فراهم ميآورد که به توسعة راهبردي نظريههاي ديني و تفسير منجر ميشود و به ارتقاي دانش و آموزش در زمينههاي فلسفه و دين کمک ميکند. براي ارزيابي و سنجش کارايي و صحت عملکرد رويکردهاي ماشيني قرآن کريم چند معيار و شاخص کليدي ارزيابي معرفي ميکنيم که امکان تحليل و مقايسة نتايج راهکارهاي مبتنيبر NLP را فراهم ميکنند.
کليدواژهها: واکاوي ساختاري، پردازش زبان طبيعي، جمعسپاري، شناسايي الگوها، تحليل معنايي.
مقدمه
تحليل عميق متون ديني، بهويژه قرآن، به دليل پيچيدگيهاي ساختاري و معنايي آن با چالشهاي متعددي روبهروست. تنوع زباني، ساختار پيچيدة متون و حجم عظيم اطلاعات موجود، موانعي بر سر راه درک دقيق و کامل اين آثار ارزشمندند. مقايسه و تحليل جامع تمام متون مذهبي، براي يک انسان کاري تقريباً غيرممکن و براي رايانهها نيز وظيفهاي پيچيده بهشمار ميرود. استفاده از پردازش زبان طبيعي (NLP) در تحليل مفاهيم قرآني و ارائة ابزارهاي قدرتمند ميتواند بخشي از يک راهبرد فرهنگي جامع براي ترويج فهم و درک عميقتر از قرآن کريم در بين مردم باشد.
پردازش زبان طبيعي بهعنوان يکي از زمينههاي نوظهور و چشماندازهاي شگفتانگيز هوش مصنوعي، ابزاري قدرتمند براي تحليل متون ارائه ميدهد. NLP با بهرهگيري از تکنيکهاي پيشرفتة محاسباتي و يادگيري ماشين، قادر به درک مفاهيم و اطلاعات موجود در متون زبان طبيعي است (Hupkes et al, 2023; Patil et al, 2023). اين قابليت فرصتي بينظير براي تحليل عميقتر و گستردهتر متون مذهبي و دستيابي به الگوهاي عميق نهفته در اين متون فراهم ميکند (آذري و ديگران، 1399).
در سالهاي اخير روشهاي مختلفي با رويکردهاي سنتي براي بسياري از مراحل که شامل شناسايي آيات و واژگان و طبقهبندي موضوعي (معجم موضوعي) آنهاست، بهکار گرفته شده است (بهجتپور، 2014م؛ ايازي، 1389؛ فريادرس، 2015م)؛ اما اين روشها کمتر، از تواناييهاي پيشرفتة NLP بهره بردهاند. رويکردهاي سنتي معمولاً از تکنيکهاي سادهتري مانند تجزيهوتحليل مبتنيبر واژگان روشهاي دستي براي تفسير و طبقهبندي مفاهيم استفاده ميکنند. با بهرهگيري از مدلهاي پيشرفتة NLP، مانند بردارواژگان و GloVe، که قادر به نگاشت کلمات به فضاي برداري هستند و روابط معنايي بين کلمات را بهخوبي منعکس ميکنند، ميتوانيم به تحليل دقيقتر و جامعتري از متون قرآني دست يابيم. اين رويکرد به تخصصهاي مختلف، از جمله علوم رايانه، زبانشناسي و علوم قرآني و اسلامي نياز دارد تا بتواند بهطور مؤثر به شناسايي و تحليل مفاهيم و الگوهاي پيچيده در متون قرآني بپردازد. اين روشها، اگرچه در زمان خود کارآمد بودهاند، توانايي درک و تحليل عميقتر و دقيقتر متون قرآني را ندارند. به همين دليل سختي اين پژوهش و پيچيدگيهاي موجود در تحليل متون قرآني با استفاده ازNLP، يک رويکرد جمعسپاري ميانرشتهاي را ميطلبد. همچنين تدوين راهبردهاي فرهنگي مبتنيبر تحليل دقيق متون ديني نيازمند رويکردي ميانرشتهاي است که از تخصصهاي مختلف علوم رايانه، زبانشناسي، معناشناسي و علوم اسلامي بهرهمند باشد. چهارچوب پيشنهادي، همکاري و تعامل ميان متخصصان مختلف را فراهم ميکند که به درک بهتر و جامعتري از مفاهيم قرآني منجر ميشود. اهداف اصلي اين پژوهش عبارتاند از:
ـ ارائة چهارچوبي نوآورانه براي تحليل قرآن با استفاده از NLP؛
ـ راهبردي نوين براي استخراج مفاهيم و معاني عميق از متن قرآن؛
ـ راهکاري براي بررسي ارتباطات معنايي بين آيههاي مختلف قرآن.
با انجام اين پژوهش اميدواريم که گامي در جهت درک عميقتر و جامعتر قرآن کريم برداريم و به توسعة راهبردي نظريههاي فلسفي و ديني وابسته به قرآن کمک کنيم.
1. پيشينة پژوهش
در سالهاي اخير شاهد پيشرفتهاي چشمگيري در زمينة پردازش زبان طبيعي و يادگيري ماشين بودهايم. اين پيشرفتها به توسعة مدلهاي NLP قدرتمندي منجر شده است که ميتوانند براي انجام کارهاي مختلفي مانند ترجمة ماشيني، تشخيص گفتار و استخراج اطلاعات از متن استفاده شوند. علاوه بر اين، رشد فناوريهاي جديد بهمانند شبکههاي عصبي عميق به افزايش دقت و کارايي مدلهاي NLP کمک کرده است. اين پيشرفتها زمينه را براي تحقيقات جديد در زمينة NLP مهيا کرده و امکان انجام کارهايي را که قبلاً غيرممکن بهنظر ميرسيد، فراهم ساخته است.
بردارهاي جمله ابزاري قدرتمند براي نمايش معناي جمله بهصورت عددياند. اين بردارها ميتوانند براي انجام کارهايي مانند ترجمة ماشيني، تجزيهوتحليل احساسات، و پاسخ به سؤالات استفاده شوند. با اينکه تحقيقات زيادي در زمينة بردارهاي جمله براي زبانهاي انگليسي و اروپايي انجام شده است، هنوز نياز زيادي به تحقيقات بيشتر در زمينة بردارهاي جمله براي زبان عربي وجود دارد. اين امر به دليل ساختار پيچيدة زبان عربي و کمبود منابع آموزشي براي مدلهاي NLP است. اين پژوهش در زمينة بردارهاي جمله براي متون عربي ميتواند به پر کردن اين فاصله و بهبود درک ما از زبان عربي کمک کند. در ادامه، برخي از پژوهشهاي مرتبط را بررسي ميکنيم.
جدول 1: کارهاي مرتبط
چکيده مرجع
در اين مقاله بر اساس سه روش tf-idf، word2vec و همنشيني ريشه در آيات، تشابه ريشههاي قرآني محاسبه شده است؛ سپس ميزان تشابه مفاهيم موجود در سورهها با يکديگر محاسبه و با حالت تصادفي مقايسه ميشود. نتايج نشان ميدهند که سورههاي مورد مطالعه انسجام دروني مفاهيم را بهگونهاي حفظ ميکنند که در يک موضوع يا چند موضوع مرتبط با يکديگر شکل گرفتهاند. علاوه بر اين، بررسي شباهت بخش اول و بدنة هر سوره نشان ميدهد که ساختار مقدمه و تبيين با روش طراحيشده براي بسياري از سورهها صادق است. (Khadangi et al, 2022)
در اين مطالعه، يک روش تگگذاري POS کارآمد براي متن عربي با استفاده از الگوريتم بهينهسازي کلوني زنبور بررسي ميشود. مسئلة تگگذاري POS بهعنوان يک گراف نشان داده ميشود و روشي جديد براي اختصاص ارزشگذاري انتقال به هر برچسب کلاسواژهاي که ممکن است احتمالي نباشد، پيشنهاد ميشود؛ سپس زنبورها بهدنبال بهترين مسير حل مسئله ميگردند. مجموعهدادة مورد استفاده در اين مطالعه، از مجموعهدادة ترجمهشدة قرآن تشکيل شده است که شامل 150 جملة کامل ساده بهعنوان يک دسته دادة آسان، پنجاه جمله با بيش از يک S/P/O/K بهعنوان يک دسته دادة متوسط و پنجاه آية قرآن انتخابشده بهعنوان يک دسته دادة دشوار است. (Arief Fatchul et al, 2021)
اعمال تکنيکهاي پردازش زبان طبيعي بر روي متن قرآن براي استخراج حروف تجويدي، يک مرحلة مهم از استخراج اطلاعات (IE) است.. اين تحقيق روشهاي NLP را در متن قرآني با استفاده از GATE، يک محيط NLP انعطافپذير ارائه ميکند.GATE براي اين تحقيق بهمنظور ساخت برنامه استفاده ميشود که مجموعه دادههاي متني قرآن است. برنامة ساختهشده با استفاده از معيارهاي دقت و بازخواني ارزيابي ميشود. (Auhood et al, 2013)
در اين پژوهش، ماژول پردازش زبان طبيعي براي متن به گفتار عربي معرفي شده است که HQB-ATTS نامگذاري شد. سيستم HQB-ATTS با استفاده از برخي از قوانين تجويدي که در عربي استاندارد استفاده ميشود، پيادهسازي شده است. (Bana et al, 2016)
اين مقاله از يادگيري انتقالي استفاده ميکند تا اطلاعات از متنهاي زبان موجود (متن قرآن) را به مسئلة درک خواندن ماشيني انتقال دهد. براي اثبات کارايي روش پيشنهادي ما، آزمايشها روي مجموعهدادة Quran QA 2022 انجام شده است. در انجام آزمايشها، ما نشان ميدهيم که روش پيشنهادي ما نسبتبه روشهاي موجود در اين حوزه بهبودهاي معناداري را ايجاد کرده است. (Damith et al, 2022)
اين مقاله روششناسي عيني و طراحي يادگيري ماشيني تفسير قرآن را با استفاده از پيشرفتهاي فناوري علوم داده پيشنهاد ميکند که از فناوري هوش مصنوعي شامل يادگيري ماشين و پردازش زبان طبيعي استفاده کرده است. (Dardya et al, 2021)
در اين مقاله با استفاده از روشهاي پردازش زبان طبيعي، موضوع همساني سورههاي قرآني بررسي ميشود. در اين راستا، بر اساس دو روش word2vec و همراهي ريشه در آيات، تشابه ريشههاي قرآني محاسبه شده است؛ سپس ميزان تشابه عنوان سورهها با مفاهيم درون سوره مورد بررسي قرار ميگيرد. نتايج نشان ميدهند که انتخاب عنوان سوره مبتنيبر منطق عقلي است و اين امر از سوي عموم مردم عادي اوايل دوران اسلامي امکانپذير نبوده است. (Ehsan et al, 2018)
اين مقاله يک مدل دستهبندي چند برچسبي مجموعهاي را ارائه ميدهد که بهطور خودکار آيات قرآن را بر اساس مضامين/موضوعات شناسايي و طبقهبندي ميکند. آيات با استفاده از تکنيکهاي فرکانس معکوس فرکانس سند (TF-IDF) و word2vec به بردارهاي ويژگي تبديل ميشوند. Word2vec براي در نظر گرفتن جنبۀ معنايي کلمات قرآني و بهبود عملکرد استفاده ميشود. همچنين آنها بر روي يک مجموعة کلاسيک عربي جمعآوريشده از دويست ميليون کلمه آموزش ميبينند؛ سپس تکنيک طبقهبندي چندبرچسبي مرتبط باينري با استفاده از سه طبقهبنديکنندة مختلف اعمال ميشود: رگرسيون لجستيک، ماشين بردار پشتيبان و جنگل تصادفي، که آيات را به 393 موضوع/برچسب دستهبندي ميکند. (Ensaf Hussein et al, 2021)
اين مقاله الگوريتمها و رويکردهايي را ارائه ميکند که براي استخراج دادههاي انبوه از منابع متني عظيم عربي، از جمله قرآن کريم و کتابهاي مرتبط با آن، طراحي شدهاند. مجموعهدادة نهايي در برگههاي اکسل و فرمت رکوردهاي پايگاه داده نمايش داده ميشود. همچنين اين مقاله مدلهايي از مجموعهداده را در تمام سطوح ارائه ميکند. مجموعهدادههاي قرآني ارائهشده در اين مقاله بهگونهاي طراحي شده است که براي پايگاه داده، دادهکاوي، متنکاوي و کاربردهاي هوش مصنوعي مناسب باشد. (Mohamed Osman et al, 2015)
در اين مقاله تکنيکهاي مدلسازي براي تنظيم چهارچوبي براي جستوجوي معنايي در قرآن کريم مورد بررسي قرار گرفته است. ازآنجاکه قرآن کريم کلام خداوند است، معاني آن نامحدود است. در اين مقاله، کلمات سورة يوسف از قرآن کريم بر اساس تکنيکهاي مدلسازي موضوعي بهعنوان مطالعة موردي تحليل شده است. تکنيک مدلسازي موضوعي تخصيص ديريکلة پنهان (LDA) در اين مقاله در دو ساختار حزب و آيات استفاده شده است. (Mohammad and Mohammad, 2015)
اين مقاله به بررسي تلاشهاي مختلف در زمينة NLP قرآني ميپردازد که بهعنوان خلاصهاي از آثار (ابزار، مجموعهدادهها، رويکردها) ارائه ميشود که گسترهاي از تحليل ريختشناسي خودکار تا تصحيح تلاوت قرآن از طريق تشخيص گفتار را پوشش ميدهد. در صورت لزوم، چندين رويکرد براي چندين کار مورد بحث قرار گرفته است. در نهايت، مسيرهاي تحقيقاتي آينده در اين زمينه را بيان ميکنيم. (Muhammad Huzaifa et al, 2023)
اين تحقيق در پي شناخت کلمة «النور» انجام شده است («علم و هدايت و هسته و ايمان» و آية 35 سورة نور). اين آيه به اين دليل انتخاب شده است که در مورد سلطنت الله تعالي و نور خدا صحبت ميکند. در نهايت، کارايي اين پژوهش با استفادة الگوريتم «خوشهبندي تفريقي و خوشهبندي تفريق وزني» اندازهگيري شده و از زبان Matlab (2013) براي دستيابي به جنبة کاربردي تحقيق استفاده کرده است. (Nima and Nima, 2020)
اين مقاله به تشريح ساخت يک روش تشخيص موجوديت نامدار مبتنيبر قاعده براي استخراج موجوديتهاي موجود در ترجمة انگليسي بهمعناي متن قرآن و ارزيابي عملکرد آن ميپردازد. (Shasha Arzila and Saidah, 2022)
اين پژوهش با هدف تحليل کاربرد روشهاي برنامهريزي زباني NLP/Neuro Linguistic در ارتقاي کيفيت حفظ قرآن در مرکز اسلامي انجام شده است. نتايج تحقيق نشان ميدهد که اجراي روش برنامهريزي زباني NLP/عصبي باعث بهبود کيفيت حفظ قرآن در مرکز اسلامي ميشود. (Syamsu et al, 2023)
اين مقاله يک ابزار جستوجوي معنايي قرآن را توسعه داده است که آيات مربوط به سؤال يا درخواست کاربر را پيدا ميکند. براي دستيابي به اين هدف، چندين مدل را بر روي مجموعهدادة بزرگي از بيش از سي تفسير آموزش داد که معمولاً هر تفسير با يک آيه در قرآن مطابقت دارد و با استفاده از تشابه کسينوس، تانسور تفسيري را بهدست آورد که شبيهترين تانسور مورد علاقه است؛ سپس براي نمايهسازي آية مربوطه در قرآن استفاده شد. (Yasser and Maged, 2023)
در اين پژوهش، جاسازيهاي کلمه با تکنيکهاي يادگيري عميق براي شناسايي آيات قرآن در محتواي متني عربي بررسي شد. کار پيشنهادي با استفاده از دوازده مدل جاسازي کلمه مختلف با دو طبقهبنديکنندة محبوب براي طبقهبندي باينري، يعني «شبکة عصبي کانولوشن» و «حافظة کوتاهمدت طولاني (LSTM)» ارزيابي ميشود. نتايج تجربي، برتري رويکرد پيشنهادي را بر روشهاي سنتي در تشخيص آيات قرآن و متن عربي با دقت 33/98 درصد نشان داد. (Zineb et al, 2022)
اين مقاله به بررسي ابزارهاي مختلف بازنمايي کلمات مورد استفاده در محتواي متون قرآن کريم به زبان عربي ميپردازد که شامل دو شکل اصلي نمايش محلي و بازنمايي توزيعشده با هدف استفاده از آنها در زيرمجموعههاي مختلف هوش مصنوعي است؛ مانند الگوريتمهاي «يادگيري ماشيني» و «يادگيري عميق» که به NLP نياز دارند. (Zineb et al, 2020)
هدف مقاله تعيين مسيري براي تبيين فناورانة مفهوميابي از آيات قرآن است. مفهوميابي يکي از مراحل اصلي روش تحقيق موضوعي در قرآن کريم است و درعينحال در ساير مطالعات مرتبط با فهم قرآن ميتواند بهکار گرفته شود. استفاده از دانش متنکاوي رايانشي براي پردازش متون، روشي متداول در فناوري دنياي امروز است. قرآن کريم نيز بهعنوان يک متن و زبان، مورد توجه اين دانش قرار گرفته است. (آذري و ديگران، 2020م)
در اين مقاله با استفاده از تفسير راهنما، موضوعات مطرحشده در هريک از سورههاي قرآن کريم شناسايي و ميزان شباهت بين سورهها بر اساس موضوعات مشترک آنها با استفاده از معياري کمي و روشهاي دادهکاوي محاسبه شده است. در نهايت، درختوارة شباهت موضوعي سورهها بر اساس معيار کمي مورد نظر ترسيم و با استفاده از آن، سورههاي قرآن به خوشههايي افراز شدهاند. (صوفي و ديگران، 2018م)
در اين مقاله الگوريتمهاي مختلف دادهکاوي و متنکاوي روي قرآن بررسي شده و از جنبههاي مختلف با يکديگر مقايسه شدهاند. (يزدانپرستي و اسماعيلي، 1394)
در اين مقاله با هدف ارائة رويکردي فناورانه براي مفهوميابي از آيات قرآن، از دانش متنکاوي و يادگيري ماشين استفاده ميکنيم. متنکاوي بهعنوان شاخهاي از هوش مصنوعي، به استخراج دانش از متنهاي حجيم ميپردازد. يادگيري ماشين نيز ابزاري قدرتمند براي تحليل دادهها و کشف الگوهاي پنهان در آنهاست. (آذري و ديگران، 2020م)
در اين پژوهش روشي نوين براي کشف الگوهاي معنايي در قرآن کريم با استفاده از قوانين انجمني ارائه ميشود. در اين روش، هر آية قرآن بهمثابة يک سبد خريد در نظر گرفته ميشود و کلمات آن بهعنوان اقلام موجود در آن سبد تلقي ميشوند. با بهکارگيري الگوريتمهاي استخراج قوانين انجمني، ارتباطات آماري بين کلمات در آيات مختلف قرآن تجزيهوتحليل ميشود. (Aslani and Esmaeili, 2018)
2. چهارچوب نظري روش پيشنهادي
در اين پژوهش، روشهاي مختلف NLP براي تحليل متن قرآن، تعريف کارها براي جمعسپاري، چهارچوب تحليلي و محدوديتهاي موجود بررسي خواهند شد. برخي از اين روشها عبارتاند از: الف) تجزيهوتحليل فراواني کلمات: بررسي تعداد دفعاتي که کلمات خاص در متن ظاهر ميشوند؛ ب) تحليل احساسات: طبقهبندي متن به مثبت يا منفي بر اساس لحن و اشارات آن؛ ج) استخراج موضوع: تعيين موضوع اصلي مورد بحث در متن؛ د) مدلهاي Word Embeddings: نمايش کلمات بهعنوان بردارهاي عددي که روابط معنايي بين آنها را نشان ميدهد؛ هـ) مدلهاي ترجمة ماشيني: ترجمة متن قرآن به زبانهاي مختلف براي مقايسه و تحليل.
اين پژوهش بر جمعآوري و تحليل متون مذهبي با محوريت قرآن کريم تمرکز دارد. اين کار با استفاده از روشهاي جمعسپاري و پردازش زبان طبيعي انجام ميشود. در اين پروژه، ما از جمعسپاري براي جمعآوري دادههاي متني عربي از منابع مختلف، مانند کتابها، مقالات و وبسايتها استفاده ميکنيم. اين دادهها سپس براي آموزش مدلهاي NLP مورد استفاده قرار ميگيرند. علاوه بر اين، جمعسپاري به ما امکان ميدهد که از دانش و تخصص افراد مختلف در سراسر جهان براي بهبود کارمان استفاده کنيم. بخشهاي کليدي روش پيشنهادي مطابق شکل (1) عبارتاند از:
تعريف اهداف: ابتدا بايد اهداف و انتظارات را براي اين چهارچوب مشخص کنيم؛ براي مثال، آيا هدفْ بررسي مفاهيم ديني و فلسفي در قرآن و روايات اسلامي بهشيوهاي جديد و دقيقتر است يا اينکه ميخواهيم موضوعات مشترک بين قرآن و روايات اسلامي را شناسايي کنيم؟
تعيين منابع: براي ايجاد چهارچوب، شما به منابع معتبري نياز داريد که قرآن و روايات اسلامي را پوشش دهند. اين منابع ميتوانند کتب ديني، تفاسير، روايات و متون ديني معتبر ديگر باشند.
تحليل محتوا: در اين مرحله، متون قرآن و روايات اسلامي را دقيقاً مورد بررسي قرار ميدهيم تا مفاهيم و موضوعات مختلف شناسايي شود. ميتوان بهدنبال تطابقات و تفاوتها در مفاهيم، الگوهاي تکراري و ارتباطات ميان مفاهيم بود.
تدوين چهارچوب: با توجه به تحليل محتوا، يک چهارچوب تدوين ميکنيم که به قرآنپژوهان کمک کند تا مفاهيم و موضوعات مختلف را ارزيابي و تفسير کنند. اين چهارچوب ممکن است شامل دستهبندي مفاهيم، ايجاد الگوهاي معنايي، تشخيص تطابقات و تفاوتها، و ديگر عناصر مرتبط با تحليل محتوا باشد.
بررسي و ارتقا: پس از ايجاد چهارچوب اوليه، آن را بازبيني کرده، بهبودهاي لازم را اعمال ميکنيم. از کارشناسان ديني و متخصصان پردازش زبان طبيعي نظرخواهي ميکنيم تا چهارچوب بهبود يابد. اين مرحله بر ضرورت رويکرد ميانرشتهاي در اين زمينه تأکيد دارد و نشان ميدهد که تعامل ميان تخصصهاي مختلف ميتواند به تدوين و اجراي راهبردهاي فرهنگي مؤثر، که بر پاية تحليل دقيق متون ديني استوار است، منجر شود.
اجرا و ارزيابي: چهارچوب خود را بر روي دادهها و متون مورد نظر اجرا و نتايج را ارزيابي ميکنيم. آيا چهارچوب به تحليل و تفسير مفاهيم ديني و فلسفي در قرآن و روايات اسلامي کمک کرده است؟ آيا موجب شناخت بهتر و عميقتر از مفاهيم شده است؟ همچنين ضروري است که در هر مرحله از ايجاد چهارچوب، با تيمي از متخصصان ديني، متخصصان پردازش زبان طبيعي و ديگر افرادي که در زمينة مورد نظر تخصص دارند، همکاري کنيم تا به نتايج بهتري دست يابيم.
شکل 1: رويکرد پيشنهادي
3. تعريف کارها
چهارچوب پيشنهادي ما شامل مراحل متعددي است که هريک بهطور خاص به ارتقاي دقت و انسجام در تحليل و تفسير متون قرآني ميپردازد. اين مراحل شامل پيشپردازش متن، استخراج ويژگي، مدلسازي، تفسير و تحليل هستند. در مرحلة پيشپردازش متن، آيات قرآني با استفاده از تکنيکهاي پيشرفتة پردازش زبان طبيعي تصحيح و استانداردسازي ميشوند تا براي تحليلهاي بعدي آماده شوند. در مرحلة استخراج ويژگي، ويژگيهاي کليدي هر آيه با استفاده از مدلهاي Word Embeddings، مانند Word2Vec و GloVe استخراج ميشوند تا مفاهيم اصلي هر کلمه در فضاي برداري نمايان شود. مرحلة مدلسازي شامل استفاده از الگوريتمهاي يادگيري ماشين مانند BiLSTM-CRF براي تحليل نحوي و معنايي جملات است. در نهايت، مراحل تفسير و تحليل با بهرهگيري از تکنيکهاي تحليل معنايي و شناسايي الگوهاي مفهومي، به استخراج و تفسير دقيق مفاهيم آيات ميپردازد.
علاوه بر اين، ميتوان وظايف مختلف اين چهارچوب را به متخصصان مختلف در زمينههاي زبان عربي، يادگيري ماشين، علوم قرآني و تفسير، برونسپاري کرد. اين رويکرد ميانرشتهاي نهتنها سبب ارتقاي دقت و انسجام در مفهوميابي آيات ميشود، بلکه باعث ميشود که هر بخش از فرايند توسط متخصصي که در آن زمينه تبحر دارد، انجام گيرد. مدلهاي يادگيري ماشين ميتوانند مفاهيم کليدي آيات را با دقت و انسجام بيشتري نسبتبه روشهاي سنتي شناسايي و دستهبندي کنند که اين امر به تفسيري دقيقتر و جامعتر منجر ميشود. در شکل (2)، انواع کارهايي که آمادة جمعسپاري در چهارچوب پيشنهادي هستند، بهعنوان يک نقشة ذهني جامع نشان داده شده است. اين نقشة ذهني ميتواند بهعنوان راهنمايي براي تقسيم وظايف و برونسپاري کارها به متخصصان مربوطه مورد استفاده قرار گيرد که نتيجة آن، تحليلي دقيقتر و منسجمتر از متون قرآني خواهد بود.
شکل 2: نقشة ذهني ابعاد واکاوي قرآن با NLP
4. ابعاد چهارچوب واکاوي تحليلي مفاهيم قرآني با استفاده از پردازش زبان طبيعي
چهارچوب واکاوي تحليلي مفاهيم قرآني با استفاده از پردازش زبان طبيعي، رويکردي مبتنيبر جمعسپاري است که به تحليل و درک عميقتر مفاهيم قرآني ميپردازد. اين چهارچوب از چندين مؤلفة کليدي تشکيل شده است که در زير به آنها اشاره ميشود.
1ـ4. رويکرد جمعسپاري
رويکرد جمعسپاري در اين چهارچوب نقش اساسي دارد. اين رويکرد بر اساس همکاري چندين فرد يا سيستم براي رسيدن به هدف مشترک، يعني تحليل مفاهيم قرآني، استوار است.
2ـ4. پردازش زبان طبيعي
پردازش زبان طبيعي زيرمجموعهاي از هوش مصنوعي است که با تعامل بين رايانهها و زبان طبيعي انسان سروکار دارد. در چهارچوب تحليل مفاهيم قرآني، NLP براي پردازش و تحليل متن قرآن بهکار ميرود تا الگوها، روابط و معاني را در متن شناسايي کند.
3ـ4. تحليل معنايي
تحليل محتوا در چهارچوب بهکار ميرود تا الگوها، موضوعات و معاني را در متن قرآن شناسايي کند. اين تحليل ميتواند براي شناسايي، بافت و روابط بين مفاهيم قرآني استفاده شود.
4ـ4. تحليل ساختاري
تحليل ساختاري در چهارچوب بهکار ميرود تا ساختار زيربنايي متن قرآن را بررسي کند. اين تحليل ميتواند براي درک بهتر سازماندهي، روابط و معاني مفاهيم قرآني استفاده شود.
جدول 2: ابعاد کليدي چهارچوب پيشنهادي و معيارهاي ارزيابي
توضيحات معيار ارزيابي بعد دوم: کاربردهاي جمعسپاري بعد اول: تکنيکهاي NLP
اين شاخص درصد کلمات بهدرستي تفسيرشده در مجموعهداده را اندازهگيري ميکند. WSE : ارزيابي رفع ابهام معنايي کلمات رفع ابهام معنايي کلمات: ميتوان از جمعسپاري براي پالايش جاسازي کلمات و بهبود توانايي آنها در درک ظرافتهاي واژگان قرآني استفاده کرد. جاسازي کلمات
اين شاخص کيفيت خلاصهسازي متن را با مقايسة آن با خلاصههاي مرجع ارزيابي ميکند. ارزيابي خلاصهسازي متن خلاصهسازي متن: ميتوان از جمعسپاري براي توليد خلاصهاي از آيات و سورههاي قرآني استفاده کرد که فهم و دسترسي به آنها را آسانتر ميکند. تقسيمبندي جمله
اين شاخص دقت و توانايي سيستم را در تشخيص درست احساسات آيات قرآني اندازهگيري ميکند. F1-score : دقت و بازخواني براي تجزيهوتحليل احساسات تجزيهوتحليل احساسات: ميتوان از جمعسپاري براي تجزيهوتحليل احساسات آيات قرآني استفاده کرد و بينشي در مورد لحن احساسي و پيامهاي نهفته ارائه کرد. برچسبگذاري اجزاي گفتار
اين شاخص توانايي سيستم را در شناسايي و دستهبندي موجوديتهاي نامدار مانند افراد، مکانها و رويدادها در قرآن اندازهگيري ميکند. دقت، بازخواني و F1-score براي شناسايي موجوديت نامدار مدلسازي موضوع: ميتوان از جمعسپاري براي شناسايي و دستهبندي موجوديتهاي نامدار در قرآن، مانند افراد، مکانها و رويدادها استفاده کرد. شناسايي موجوديت نامدار
اين شاخص توانايي سيستم را در پاسخگويي دقيق و مرتبط به سؤالات مربوط به قرآن اندازهگيري ميکند. رتبة متقابل ميانگين براي پاسخ به سؤال پاسخ به سؤال: ميتوان از جمعسپاري براي توسعة سيستمهايي استفاده کرد که ميتوانند به سؤالات مربوط به قرآن پاسخ دهند و اطلاعات سريع و دقيقي را به کاربران ارائه دهند. مدلسازي موضوع
اين شاخص کيفيت ترجمة ماشيني قرآن را با مقايسة آن با ترجمههاي انساني مرجع ارزيابي ميکند. ارزيابي ترجمة ماشيني تجزيهوتحليل چندزبانة قرآن: ميتوان از جمعسپاري براي تسهيل ترجمة قرآن به زبانهاي مختلف استفاده کرد و دامنة دسترسي آن را به مخاطبان گستردهتر گسترش داد. ترجمة ماشيني
اين شاخص توانايي سيستم را در طبقهبندي صحيح آيات قرآني بر اساس موضوع، مضمون يا هدف آنها اندازهگيري ميکند. دقت: درصد آيات بهدرستي طبقهبنديشده طبقهبندي آيات قرآني: ميتوان از جمعسپاري براي طبقهبندي آيات قرآني بر اساس مضامين، موضوعات يا اهداف آنها استفاده کرد. طبقهبندي متن
اين شاخص انسجام و قابليت اتکاي لينکها بين مفاهيم، آيات و موجوديتهاي مختلف در نمودار دانش قرآني را اندازهگيري ميکند. کيفيت لينک: انسجام و قابليت اتکاي متوسط لينکها ساخت نمودار دانش قرآني: ميتوان از جمعسپاري براي ساخت نمودار دانشي استفاده کرد که آيات، مفاهيم و موجودات قرآني را بههم مرتبط ميکند. استخراج رابطه
علاوه بر ابعاد اصلي چهارچوب پيشنهادي، ابعاد ديگري لازم است بهعنوان ابعاد تکميلي در واکاوي تحليلي مفاهيم قرآني با استفاده از پردازش زبان طبيعي در نظر گرفته شوند که در جدول (3) جمعبندي و سازماندهي شدهاند.
5ـ4. روششناسي تحقيق کيفي
چهارچوب از روششناسي تحقيق کيفي استفاده ميکند که بر جمعآوري و تحليل دادههاي غيرعددي تمرکز دارد. اين روش براي درک عميقتر مفاهيم قرآني و روابط بين آنها مناسب است.
6ـ4. فرايند چرخهاي تحليل
فرايند چرخهاي تحليل در چهارچوب بهکار ميرود تا دادهها را بهصورت مداوم جمعآوري، تحليل و تفسير کند. اين فرايند به درک عميقتر مفاهيم قرآني و شناسايي الگوها و روابط جديد در متن کمک ميکند.
7ـ4. ديدگاه اسلامي
چهارچوب بر اساس ديدگاه اسلامي استوار است؛ بدين معنا که تحليل مفاهيم قرآني از ديدگاه اسلامي و با توجه به بافت فرهنگي و تاريخي قرآن انجام ميشود.
8ـ4. مدلسازي پويا
مدلسازي پويا در چهارچوب بهکار ميرود تا سيستمهاي پيچيده و رفتار آنها را در طول زمان نمايش دهد. در تحليل مفاهيم قرآني، از مدلسازي پويا ميتوان براي نمايش روابط بين مفاهيم و تکامل آنها در طول قرآن استفاده کرد.
9ـ4. رويکرد ميانرشتهاي
چهارچوب از رويکرد ميانرشتهاي استفاده ميکند که بر تلفيق ديدگاهها و روششناسيهاي مختلف از رشتههاي گوناگون، مانند علوم رايانه، زبانشناسي، الهيات، فلسفه و مطالعات تاريخي و فرهنگي استوار است. اين رويکرد به درک عميقتر مفاهيم قرآني و شناسايي روابط بين آنها کمک ميکند.
جدول 3: ابعاد تحليلي روش پيشنهادي
متغيرهاي مؤثر در ارزيابي توضيحات ويژگيها معيار/زيرمعيار
تعداد شرکتکنندگان ـ همکاري چندين فرد يا سيستم براي تحليل مفاهيم قرآني رويکرد جمعسپاري
اعتماد به دقت برچسبها ـ پايهگذاري بر اعتماد به همکاران و سيستمها
تنوع برچسبها ـ انعطافپذيري در استفاده از اطلاعات و تجربيات شرکتکنندگان
رضايت شرکتکنندگان ـ استفاده از مکانيسمهاي تشويقي براي حفظ و تشويق همکاري
ـ بررسي صحت و اعتماد به دقت برچسبگذاري و تحليل مشارکتکنندگان
دقت در تحليل مفاهيم ـ توانايي شناسايي الگوها و روابط معاني در متن قرآن پردازش زبان طبيعي
پوشش گستردة مفاهيم ـ قابليت استفاده از الگوريتمهاي مختلف براي تحليل متون
سرعت پردازش متن ـ انعطافپذيري در تطبيق با متون با ساختار متنوع و زبانهاي مختلف
ـ دقت و قابليت اعتماد در تشخيص معاني و روابط متني
دقت در تحليل الگوها و موضوعات ـ شناسايي الگوها، موضوعات و معاني در متن قرآن تحليل محتوا
انعطافپذيري در شناسايي مفاهيم ـ درک بهتر سازماندهي و روابط بين مفاهيم قرآني
دقت در تحليل ساختار ـ بررسي ساختار زيربنايي متن قرآن تحليل ساختاري
ـ شناسايي روابط و معاني مفاهيم در ساختار متن
دقت در تحليل دادهها ـ تمرکز بر جمعآوري و تحليل دادههاي غيرعددي روششناسي
تحقيق کيفي
انعطافپذيري در تحليل ـ توانايي در درک عميقتر مفاهيم قرآني و روابط بين آنها
پيگيري و انعطافپذيري فرايند ـ جمعآوري، تحليل و تفسير دادهها بهصورت مداوم فرايند چرخهاي تحليل
ـ شناسايي الگوها و روابط جديد در طول زمان
کارايي و کاربردي بودن ابزار ـ استفاده از نرمافزارها، الگوريتمها و ابزارهاي ديجيتال طراحيشده براي تحليل مفاهيم قرآني ابزارهاي ساختهشده
تطابق با مفاهيم اسلامي ـ تحليل مفاهيم قرآني از ديدگاه اسلامي و با توجه به بافت فرهنگي و تاريخي قرآن ديدگاه اسلامي
پوشش زماني مفاهيم ـ نمايش سيستمهاي پيچيده و رفتار آنها در طول زمان مدلسازي پويا
ـ نمايش تکامل مفاهيم قرآني و روابط بين آنها در طول قرآن
تنوع و کارايي در تحليل ـ تلفيق ديدگاهها و روششناسيهاي مختلف از رشتههاي گوناگون رويکرد ميانرشتهاي
ـ بهبود درک عميقتر مفاهيم قرآني و شناسايي روابط بين آنها
بهطورکلي چهارچوب واکاوي تحليلي مفاهيم قرآني با استفاده از پردازش زبان طبيعي، رويکردي مبتنيبر جمعسپاري است که براي تحليل و درک عميقتر مفاهيم قرآني طراحي شده است. اين چهارچوب با تلفيق مؤلفههاي مختلف، ابزار قدرتمندي براي تحليل و درک مفاهيم قرآني فراهم ميکند.
5. معيارهاي تحليل و ارزيابي
ارزيابي و سنجش کارايي و صحت رويکردهاي ماشيني قرآن کريم و کتب مهم اهميت بسياري دارد و همواره از دغدغههاي اصلي پژوهشگران و مفسران است. در اين راستا، چهار معيار و شاخص کليدي براي ارزيابي اين روشها معرفي ميکنيم: 1. دقت: براي بررسي ميزان صحت و درستي مفاهيم و معاني استخراجشده از متون قرآني، که شاخصهاي سنجش آن عبارتاند از: نرخ تناقض (ميزان مغايرت با تفاسير معتبر)، نرخ ابهام (ميزان عدم وضوح مفاهيم استخراجشده) و نرخ صحت معنايي (ميزان انطباق با معناي مورد نظر آيه)؛ 2. انعطافپذيري: به توانايي روش در انطباق با طيف وسيعي از متون قرآني، با موضوعات و ساختارهاي مختلف ميپردازد و شاخصهاي سنجش آن عبارتاند از: ميزان پوشش موضوعات (تعداد و تنوع موضوعات قابل تحليل)، ميزان تطبيق با ساختارها (توانايي تحليل آيات با ساختارهاي متفاوت) و سهولت بهکارگيري؛ 3. پوشش: به جامعيت روش در تحليل و استخراج مفاهيم و معاني متنوع موجود در متون قرآني اشاره دارد و شاخصهاي سنجش آن عبارتاند از: تعداد مفاهيم استخراجشده، عمق مفاهيم استخراجشده (از کليات تا جزئيات) و تطابق با مفاهيم کليدي (انطباق با مفاهيم بنيادي در علوم قرآني)؛ 4. صحت اطلاعات: به ميزان قابل اعتماد بودن و اتکا به اطلاعات و مفاهيم استخراجشده از متون قرآني ميپردازد. شاخصهاي سنجش صحت اطلاعات عبارتاند از: اعتبار منابع و مدارک، تطابق روششناسي با اصول علمي و وجود فرايندهاي بازبيني و نظارت توسط متخصصان. خلاصة معيارها و شاخصهايي که براي ارزيابي و تحليل مفاهيم و معاني در متون قرآني مورد استفاده قرار ميگيرد، در جدول (4) نشان داده شده است.
جدول 4: معيارهاي ارزيابي و تحليل چهارچوب پيشنهادي
توضيح معيار/شاخص
ميزان صحت و دقت در تحليل و استخراج مفاهيم و معاني از متون قرآني دقت
توانايي چهارچوب براي انطباق با متون متنوع و پيچيدة قرآني بهصورت انعطافپذير و منطبق انعطافپذيري
ميزان پوشش چهارچوب در تحليل و استخراج مفاهيم و معاني متنوعي از متون قرآني و شامل متنهاي مختلف پوشش
صحت و قابل اطمينان بودن اطلاعات و مفاهيم استخراجشده از متون قرآني صحت اطلاعات
اين معيارها و شاخصها بهعنوان ابزارهايي براي ارزيابي کيفيت و کارايي چهارچوب تحليلي واکاوي فلسفي و تحليلي از مفاهيم با پردازش زبان طبيعي در رويکرد جمعسپاري پيشنهاد ميشوند و به اين وسيله ميتوان نتايج کارهاي واگذارشده به افراد مختلف با تخصصهاي گوناگون را بررسي و بر اساس اين معيارها و شاخصها امتيازدهي کرد. در شکل (3) اين شاخصها با زيرمعيارهاي آن نشان داده شدهاند.
شکل 3: معيارهاي ارزيابي بههمراه زيرمعيارها
موارد ارزيابي و ارزيابي دقت شامل صحت يادآوري و امتياز F1
تنوع موارد ارزيابي نشان ميدهد كه چهارچوب تا چه حد در برابر طيف وسيعي از متون قرآني با موضوعات و سبکهاي مختلف، انعطافپذيري خود را حفظ میكند. ارزيابي توسط متخصصان شامل نظرخواهي ازمتخصصان در حوزة تحليل متن قرآني و سنجش انعطافپذيري چهارچوب از ديدگاه آنهاست. نمرة انعطافپذيري بر اساس ميانگين نظرات متخصصان محاسبه ميشود. امتياز F1، معياري تركيبي است كه دقت و يادآوري را بهطور همزمان در نظر ميگيرد. اين معيار، ميانگين وزني دقت و يادآوري را نشان ميدهد و بهعنوان يك شاخص واحد براي ارزيابي عملكرد چهارچوب NLP در استخراج مفاهيم از متن قرآني بهكار ميرود. صحت نسبت تعداد مفاهيم صحيح استخراجشده به تعداد كل مفاهيم استخراجشده را نشان ميدهد. بهعبارتديگر، دقت بيانگر اين است كه از بين تمام مفاهيمي كه چهارچوب NLP از متن استخراج كرده، چه درصدي از آنها با مفاهيم واقعي موجود در متن مطابقت دارند. يادآوري، نسبت تعداد مفاهيم صحيح استخراجشده به تعداد كل مفاهيم موجود در متن را نشان ميدهد. بهعبارتديگر، يادآوري بيانگر اين است كه از بين تمام مفاهيم واقعي موجود در متن، چه درصدي ازآنها توسط چهارچوب NLP استخراج شدهاند.
پوشش شامل تنوع مفاهيم و تنوع متن صحت اطلاعات شامل نرخ خطا و ارزيابي توسط متخصصان
تنوع مفاهيم نشان ميدهد كه چهارچوب تا چه حد قادر به استخراج طيف وسيعي از مفاهيم و معاني از متون قرآني است. تنوع انواع متن نشان ميدهد كه چهارچوب تا چه حد قادر به تحليل و استخراج مفاهيم از انواع مختلف متون قرآني مانند آيات، احاديث و تفاسير است. ارزيابي توسط متخصصان شامل نظرخواهي از متخصصان در حوزة تحليل متن قرآني و سنجش صحت اطلاعات استخراجشده از ديدگاه آنهاست. نمرة صحت اطلاعات بر اساس ميانگين نظرات متخصصان محاسبه ميشود. نرخ خطا نشان ميدهد كه چه درصدي از مفاهيم و معاني استخراجشده نادرست هستند.
بهمنظور ايجاد الگويي براي استفاده از معيارها، دقت را با مثالي بررسي ميکنيم. فرض کنيد چهارچوب NLP ما وظيفه دارد تا مفاهيم کليدي را از سورة مبارکة بقره استخراج کند. اين سوره شامل 286 آيه است که هرکدام حاوي مفاهيم و معاني عميق و پيچيدهاي هستند. براي سنجش دقت چهارچوب NLP در اين وظيفه، از سه زيرمعيار صحت، يادآوري و نمرة F1 استفاده ميکنيم:
صحت: چهارچوب NLP در مجموع 1200 مفهوم از 286 آية سورة بقره استخراج ميکند. پس از بررسي توسط کارشناسان علوم قرآني، مشخص ميشود که 960 مورد از اين مفاهيم با مفاهيم واقعي موجود در متن مطابقت دارند.
صحت = (1200 / 960) * 100 = 80%
اين نتيجه نشان ميدهد که چهارچوب NLP در 80 درصد موارد، مفاهيم صحيح را از متن استخراج کرده است.
يادآوري: کارشناسان علوم قرآني پس از بررسي متن سورة بقره، 1500 مفهوم کليدي را در آن شناسايي ميکنند.
يادآوري = (1500 / 960) * 100 = 64%
اين نتيجه نشان ميدهد که چهارچوب NLP توانسته است 64 درصد از مفاهيم کليدي موجود در متن را بهدرستي استخراج کند.
امتياز F1: با توجه به مقادير دقت و يادآوري، نمرة F1 چهارچوب NLP را محاسبه ميکنيم:
امتياز = 2 * (80 + 64) / (80 * 64)= F1 71.11%
اين نمره نشان ميدهد که عملکرد چهارچوب NLP در استخراج مفاهيم از سورة بقره، «متوسط» بوده است و جاي ارتقا دارد.
در اين مثال، چهارچوب NLP توانسته است 80 درصد از مفاهيم را بهدرستي استخراج کند. بااينحال، 20 درصد از مفاهيم استخراجشده نادرست بودهاند و نياز به اصلاح دارند. براي ارتقاي دقت چهارچوب NLP، ميتوان از تکنيکهاي پيشرفتهتر NLP، مانند يادگيري عميق و شبکههاي عصبي استفاده کرد. همچنين ميتوان با استفاده از پايگاههاي دانش تخصصي در حوزة علوم قرآني، به چهارچوب NLP در درک بهتر مفاهيم و معاني متن کمک کرد.
6. محدوديتها
پردازش زبان طبيعي براي تحليل متنهاي قرآن با چالشها و سختيهاي خاصي روبهرو ميشود:
1. ساختار زباني پيچيده: قرآن به زبان عربي نوشته شده است که داراي يک ساختار زباني پيچيده و قواعد دقيقي است. اين ساختار شامل استفاده از اصطلاحات، قواعد خاص و تنوع زباني بسياري است که براي الگوريتمهاي پردازش زبان طبيعي سختي ميآفريند.
2. استفاده از مفاهيم فلسفي و ديني: قرآن بهعنوان متن ديني داراي مفاهيم فلسفي و ديني عميقي است که براي درک آنها به شناخت عميق و تخصصي از اين مفاهيم نياز است. تحليل و استخراج اين مفاهيم بهوسيلة الگوريتمهاي NLP چالش بزرگي است.
3. ترجمه و تفسير معاني چندگانه: قرآن به زبان عربي نوشته شده است و ترجمة آن به زبانهاي ديگر، معاني چندگانهاي دارد. اين موضوع باعث ميشود که الگوريتمهاي NLP براي ترجمه و تفسير متون قرآني به زبانهاي ديگر نيازمند دقت و دانش عميقي باشد.
4. حجم بزرگ متن: قرآن بهعنوان يکي از کتب مقدس و مهم ديني، داراي حجم بسيار زيادي از متن است. پردازش و تحليل کلية متنهاي قرآني بهصورت دستي يا با استفاده از الگوريتمهاي NLP نيازمند منابع محاسباتي بالا و زمان بسياري است.
5. تفسير متون با رويکردهاي مختلف: قرآن معمولاً به تفسيرهاي مختلفي تحت عناوين مختلف مورد بررسي قرار ميگيرد. اين باعث ميشود که تحليل و استخراج معاني قرآن با استفاده از الگوريتمهاي NLP دقت و کنترل بيشتري نياز داشته باشد.
اساساً پردازش متون قرآني با استفاده از NLP نيازمند الگوريتمها و روشهاي پيشرفتهاي است که بتوانند با چالشهاي يادشده برخورد کنند و به نتايج قابل قبولي برسند. استفاده از مدلهاي زباني بزرگ، بهويژه در زمينة پردازش زبان طبيعي، ميتواند بهطور قابل توجهي به پيشرفت و توسعة فناوريهاي مربوط به زبان فارسي کمک کند. اين مدلها، که اکثراً با استفاده از شبکههاي عصبي عميق آموزش داده ميشوند، قادرند به توليد متون، ترجمة خودکار، تحليل معنايي، توليد متن تصويري، پرسش و پاسخ، و بسياري ديگر از وظايف مرتبط با زبان فارسي و زبانهاي ديگر کمک کنند.
دولت ميتواند با ارائة حمايتهاي لازم از پژوهشها و پروژههاي مرتبط با پردازش زبان طبيعي در زبان فارسي، اقدام به توسعه و آموزش مدلهاي زباني متنوع و پيشرفته کند. اين اقدامات ميتوانند شامل اعطاي منابع مالي، ايجاد محيطهاي همکاري بين دانشگاهها، صنعت و دولت، تسهيل در دسترسي به دادههاي متنوع و بزرگ، و تشويق به پژوهشهاي مبتنيبر اين فناوري باشد.
جمعبندي
اين مقاله به بررسي استفاده از روشهاي نوين پردازش زبان طبيعي در تحليل متون قرآني پرداخت و نشان داد که چگونه اين رويکرد ميتواند در مقايسه با روشهاي سنتي، تحليل دقيقتر و جامعتري از مفاهيم و الگوهاي معنايي فراهم آورد. بهرهگيري از روشهاي نوين پردازش زبان طبيعي در تحليل متون قرآني نقشي کليدي در تدوين و اجراي راهبردهاي فرهنگي مؤثر ايفا ميکند. روشهاي سنتي، اگرچه در زمان خود کارآمد بودهاند، با محدوديتهاي جدي در تحليل دقيق و جامع متون روبهرويند. استفاده از مدلهاي پيشرفتة NLP امکان شناسايي و تحليل عميقتر مفاهيم و الگوهاي معنايي را فراهم ميآورد. اين رويکرد نوين ميتواند به تفسير دقيقتر آيات و واژگان قرآني کمک کند و از اين طريق زمينهساز انتقال صحيح و جذاب پيامهاي فرهنگي شود.
تدوين راهبردهاي فرهنگي مبتنيبر تحليل دقيق متون ديني نيازمند رويکردي ميانرشتهاي است که از تخصصهاي مختلف علوم رايانه، زبانشناسي و علوم اسلامي بهرهمند باشد. اين تعامل ميانرشتهاي امکان بهرهگيري از تخصصها و دانشهاي مختلف را فراهم ميکند و در نهايت به درک بهتر و جامعتري از مفاهيم قرآني منجر ميشود. در اين راستا، اين مقاله بر ضرورت رويکرد ميانرشتهاي در اين زمينه تأکيد کرد و نشان داد که تعامل ميان تخصصهاي مختلف ميتواند به تدوين و اجراي راهبردهاي فرهنگي مؤثر، که بر پاية تحليل دقيق متون ديني استوار است، بينجامد. در نهايت، بهرهگيري از اين روشها ميتواند به ارتقاي آگاهي فرهنگي و ديني در جامعه کمک کند. اين خود بستر مناسبي براي برنامهريزي و اجراي راهبردهاي فرهنگي مؤثر فراهم ميسازد که ميتواند به ارتقاي آگاهي فرهنگي و ديني در جامعه منجر شود. درنتيجه، پژوهشهاي مبتنيبر NLP نهتنها براي درک بهتر متون ديني مفيدند، بلکه نقش بسزايي در شکلدهي به راهبردهاي فرهنگي دارند که به ترويج و نهادينهسازي ارزشهاي ديني و فرهنگي در جامعه کمک ميکند. در آخر بايد اشاره کرد که نياز به پلتفرمهاي هوش مصنوعي قرآني که بتوانند بهطور خودکار تحليلهاي دقيق و جامع را ارائه دهند، بيشازپيش احساس ميشود. اين پلتفرمها ميتوانند ابزارهاي قدرتمندي براي پژوهشگران و علاقهمندان به مطالعات قرآني فراهم کنند و راهبردهاي فرهنگي را با دقت و کارآمدي بيشتري به اجرا درآورند.
- آذری، سلمان، شکرالهیفر، محمود و فشارکی، محمدعلی لسانی (1399). الگوپردازی مفهومیابی از آیات قرآن کریم با استفاده از دانش متنکاوی رایانشی. ذهن، 21(82)، 81ـ108.
- ایازی، محمدعلی (1389). نگاهی به معجمهای موضوعی قرآن کریم. بینات، 2، 33ـ127.
- بهجتپور، عبدالکریم (2014م). روش کشف الگوی اسلامی مهندسی فرهنگی. فصلنامة علمی پژوهشی راهبرد فرهنگ، 7(27)، 91ـ118.
- صوفی، محسن، علیاحمدی، علیرضا، احمدی، حسینعلی و مینایی، بهروز (1394). خوشهبندی سورههای قرآن با تکنیکهای دادهکاوی. علوم قرآن و حدیث، 26(153)، 56ـ62.
- فریادرس، زینب (2015م). گزارشی توصیفی از چهار معجم موضوعی قرآن. آینة پژوهش، 26، 56ـ62.
- یزدانپرستی، عالیه و اسماعیلی، مهدی (1394). مروری بر انواع روشهای دادهکاوی و متنکاوی روی قرآن مقدس. در: دومین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیعشده و شبکههای هوشمند.