پرش به مطلب اصلی

داده‌کاوی مقدماتی

Elementary Data Mining


نام درس:داده‌کاوی مقدماتیمقطع:کارشناسی
پیش‌نیاز:یادگیری ماشین مقدماتیگروه درس:تخصصی الزامی
هم‌نیاز:نداردنوع درس:نظری
تعداد واحد:3تعداد ساعت:48
حل تمرین:دارد

سرفصل درس:

  • مفاهیم و اصول پایه داده کاوی، انباره داده‌ها، OLAP، پیش پردازش و آماده سازی داده‌ها، پاکسازی داده‌ها، یکپارچه سازی، جایگذاری داده‌های گمشده (مفقود)، انتخاب و تبدیل ویژگی‌ها، تبدیلات روی داده‌ها، نرمال‌سازی و استانداردسازی داده‌ها، تحلیل اکتشافی و مصور‌سازی، مجموعه اقلام مکرر، قواعد انجمنی.

  • شناسایی داده‌های پرت. روش‌های رتبه‌بندی صفحات، سیستم‌های پیشنهاد دهنده، ارزیابی آنها، پالایش مشارکتی، معیارهای مختلف مقایسه، فاصله اقلیدسی، ضریب همبستگی پیرسون،‌ شباهت کسینوسی، ضریب کاپای کوهن، پالایش بر اساس اقلام، امتیازدهی صریح و ضمنی. تجزیه و تحلیل شبکه‌های اجتماعی، اشاره ای به گراف کاوی، تحلیل لینک و متن کاوی.

  • تکمیل روشهای خوشه‌بندی در درس یادگیری ماشین مقدماتی، همچون روشهای سلسله مراتبی، روشهای مبتنی بر چگالی مانند DBSCAN، روشهای مبتنی بر گرید، مانند CLIQUE، خوشه‌بندی طیفی. آشنایی با سایر روش‌های ارزیابی خوشه‌بندی.

  • معرفی برخی از نرم افزارهای تخصصی در داده کاوی، مانند RapidMiner، نحوه بارگذاری داده‌ها و تحلیل آنها بوسیله نرم افزار، ارایه پروژه های کلاسی دانشجویان.

  • نکته‌: از آنجا که برخی از موضوعات مانند روش‌های طبقه‌بندی و خوشه‌بندی با درس یادگیری ماشین مقدماتی اشتراک دارد، شایسته است مدرسین این دروس در این خصوص هماهنگ باشند. در صورت امکان می‌توان به موارد زیر هم پرداخت: روشهای کاوش الگوها در داده‌های ترتیبی و سری‌های زمانی، GSP ، SPADE،‌FreeSpan، آنالیز تناوب، Motif Discovery، Matrix Profile، الگوریتم MASS.

منابع:

  • شومیلی، ج.، بروک، پی، یاهو، آ، پاتل، ان و لیختندال، ک. (1400). داده‌کاوی برای تحلیل خودکار کسب‌وکار: مفاهیم، فنون و کاربردهای R، ترجمه دکتر محمدرضا فقیهی حبیب‌آبادی، انتشارات دانشگاه شهید بهشتی.

  • مرادی، عباس، حسین‌زاده، جواد، شباک، اشکان، کیانی، کاوه و شیری، محمد. (1398). آشنایی با مفاهیم و روشهای داده کاوی، پژوهشکده آمار

  • VanderPlas, J. (2022). Python data science handbook: Essential tools for working with data. 2nd Edition, O'Reilly Media [Github]

  • Shmueli, G., Bruce, P., Yahav, I., Patel, N., Lichtendahl, K., (2018), Data Mining for Business Analytics Concepts, Techniques, and Applications in R, Wiley.

  • Han, J., Kamber, M., Pei, J., (2012), Data Mining, Concepts and Techniques, 3rd Ed., Morgan Kaufmann Publishers, Elsevier.

  • Olson, D., (2018), Data Mining Models, 2nd Ed., Business Expert Press.

  • Carlo Vercellis, C., (2009), Business Intelligence, Data Mining and Optimization for Decision Making, Wiley.

  • Zaki, M. J., & Meira, W., (2020) Data mining and analysis: fundamental concepts and algorithms. Cambridge University Press. Retrieved from https://dataminingbook.info/

  • Leskovec, J., Rajaraman, A.,, Ullman, J. D. (2014). Mining of Massive Datasets. Cambridge University Press. http://www.mmds.org/

  • Blum, A., Hopcroft, J.,, Kannan, R. (2020). Foundations of Data Science. Cambridge: Cambridge University Press. https://www.cs.cornell.edu/jeh/book.pdf

  • James, G., Witten, D., Hastie, T., Tibshirani, R. and Taylor, J. (2023). An Introduction to Statistical Learning, with applications in Python, Springer, New York. https://www.statlearning.com/