داده کاوی فرآیندی است که توسط شرکتها برای تبدیل داده های خام به اطلاعات مفید استفاده میشود. در داده کاوی با استفاده از نرمافزار برای جستجوی الگوها در دستههای بزرگ داده، کسبوکارها می ...
دادهکاوی عبارت است از فرآیند اکتشاف الگو و روندهای منظم و پنهان در دادههای بزرگ و توزیع شده، با استفاده از مجموعه وسیعی از الگوریتمهای مبتنی بر علوم ریاضی و آمار. این الگوریتمها معمولا ...
مجموعه مذکور، کامل (بدون مقادیر از دست رفته یا Missing Values) و فاقد نویز است. همچنین، برچسبدار و دارای ۲۴ نمونه (هر سطر از مجموعه داده) است که برای هر یک چهار خصیصه بیان شده و از سال ۱۹۹۰ به صورت آزاد در دسترس عموم قرار گرفت.
«علم داده» (data science)، «تحلیل دادهها» (Data analytics)، «یادگیری ماشین» (machine learning) و «دادهکاوی» (Data Mining) با نرخ نجومی در حال رشد و توسعه هستند. از اینرو شرکتها بهدنبال کارشناسانی میگردند که با کیمیاگری دادهها به آنها ...
برخی از مردم داده کاوی را واژهای مترادف با کشف دانش در بانکهای اطلاعاتی (KDD) سرنام (knowledge discovery in databases) میدانند که برداشت نسبتا دقیقی است، زیرا دادهکاوی در راستای کشف دانش استفاده میشود ...
داده کاوی چیست و چه کاربردهایی در سازمان دارد؟ مراحل انجام داده کاوی به زبان ساده، آشنایی با الگوریتم کریسپ در علم داده کاوی، data mining چیست و چه کاربردی دارد؟
داده کاوی در دهه ۱۹۹۰ آغاز شد، این مهم فرایندی است که الگوهای لازم را در پروندههای بزرگ داده کشف میکند. با این روش، هنگامی که تجزیه و تحلیل دادهها از روشهای سنتی به روشهای مدرنتری ...
داده کاوی (Data mining) فرایند تجزیه و تحلیل حجم عظیمی از داده ها برای کشف هوش تجاری است. داده کاوی به سازمان ها در حل مشکلات، کاهش خطرات و استفاده از فرصت های جدید کمک می کند.
تکنیک های داده کاوی برای تحلیل سری زمانی: این روشها شامل تجزیه و تحلیل نقاط دادهای است که در فواصل زمانی منظم (مانند ساعتی، روزانه، ماهانه) برای درک روندها، فصلها و ناهنجاریهای بالقوه ...
در این مطلب می خواهیم در مورد مهمترین کاربردهای داده کاوی صحبت کنیم. اگرچه عبارت "دادهکاوی" برای اولینبار در دهه 1990 استفاده شد، اما پیشرفتی است که برای مدتی طولانی وجود داشته است.
چنانکه پیشتر تشریح شد، مجموعههای داده از نمونهها و ویژگیها (خصیصهها) تشکیل میشوند. یک شی داده نمایانگر یک موجودیت است. برای مثال، در پایگاهداده یک فروشگاه، مشتریان، محصولات موجود و فروشها، اشیا داده هستند ...
داده کاوی چیست؟ داده کاوی (دیتا ماینینگ | data mining) معمولاً بهعنوان فرآیند استفاده از کامپیوتر و اتوماسیون برای جستجوی مجموعههای بزرگی از دادهها برای الگوها و روندها، تبدیل آن یافتهها به بینشها و پیشبینیهای ...
انواع داده ها در یادگیری ماشین چیست؟ – به زبان ساده در این مطلب، یاد میگیریم انواع داده ها در یادگیری ماشین چیست و از چه منابعی برای پیدا کردن مجموعهدادههای کاربردی استفاده کنیم.
در عین حال، میزان زیاد و در واقع، بیش از ۵,۰۰۰ «بسته» (Package) آماده برای این زبان وجود دارد که میتوان آنها را دانلود و همراه با R استفاده کرد تا تواناییهای این زبان برای انجام وظایف گوناگون و جدید، توسعه پیدا کند.
این تکنیک با استفاده از ایمپلنتها به عنوان نقاط ثابت در فک، مشکلاتی مانند لقی، دشواری در جویدن، ناپایداری و اختلال در تکلم را که در پروتزهای متحرک کامل مشاهده میشود، به طور مؤثری برطرف می ...
در سال 1989، گریگوری پیاتتسکی-شاپیرو برای اولین بار اصطلاح «کشف دانش در پایگاه داده» (Knowledge Discovery in Database) را استفاده کرد. در دهۀ 1990، دادهکاوی برای اولین بار در بین متخصصان پایگاه داده استفاده شد.
در مدل ۳V مفهوم سرعت (Velocity) برای اندازهگیری میزان سرعت ورود دادهها استفاده میشود. برخی از دادهها بلادرنگ (Real-time) و برخی به شکل دستهای وارد میشوند.
متن کاوی (داده کاوی می تواند برای طبقه بندی مقالات، کتابها، اسناد، ایمیلها و صفحات وب در انواع متنها، که داده های غیرساختاری دارند اعمال میشود. به عنوان مثال میتوان به موتورهای جستجوی ...
در واقع داده کاوی با ایجاد ابزارهایی که استخراج این اطلاعات ارزشمند را ممکن میکند، به دادهها ارزش میبخشد و باعث میشود بتوان از آن دادهها برای برآوردن یک هدف و یا حل یک مشکل استفاده ...
در این مقاله از وبسایت اسدیتا، در خصوص ضریب همبستگی چیست؟ چگونه در تحلیل دادهها مورد استفاده قرار میگیرد؟ بحث خواهیم کرد. ضریب همبستگی یا correlation coefficient یک معیار آماری است که نشان میدهد چقدر دو متغیر با یکدیگر ...
در شماره قبل (بخش نخست مقالات دادهکاوی بر مبنای چه فرآیندهایی انجام میشود؟ ) به این نکته اشاره کردیم که دادهکاوی بر مبنای یکسری فرآیندهای تکرار شونده انجام میشود. فرآیندهایی که ممکن است حالت چرخشی داشته باشند تا ...
همچنین از داده کاوی برای تشخیص کلاهبرداری و پالایش هرزنامهها هم استفاده میشود. ... به میزان گستردهای و با تعاریف مختلفی استفاده میشود. در ظاهر به نظر میرسد این دو اصطلاح با هم یکسان ...
این روش برای طبقهبندی، تجزیه و تحلیل رگرسیون، پردازش داده ها و غیره استفاده میشود. این روش با سه رکن کار میکند: مدل; الگوریتم یادگیری (نظارت شده یا بدون نظارت) عملکرد فعالسازی; در کل ...
که در ادامه هر کدام شرح داده می شود. این روش از اهمیت ویژه ای برخوردار است لذا در ابزار SPSS Modeler در شرکت IBM نیز از این مدل برای کار با نرم افزار SPSS استفاده شده است لذا یادگیری این مدل نسبت به مدل ...
فرایند داده کاوی، فرآیندی برای کشف مدلهای مختلف، خلاصهها و مقادیر مشتق شده از مجموعه دادهها است. واژه "فرایند" در اینجا اهمیت زیادی دارد. حتی در برخی از محافل علمی این باور وجود دارد ...
توابع زیادی برای اندازهگیری فاصله بین اشیاء، با ویژگیهای کمی وجود دارد. «توابع فاصله» (Distance Functions) در تکنیکهای دادهکاوی بخصوص در خوشهبندی، کاربردهای زیادی دارند. در این متن ابتدا به معرفی خصوصیات تابع فاصله ...
[vc_section][vc_row][vc_column][vc_column_text] پیش پردازش داده (Data Preprocessing) به مراحلی گفته میشود که در آن داده ها برای داده کاوی آماده میشود. لازم به ذکر است که این مراحل جز مهم ترین گام ها در داده کاوی هستند. پس باید با دقت با مفهوم آن آشنا شد ...
روشهای انتخاب ویژگی (Feature Selection Methods) به منظور مواجهه با دادههای ابعاد بالا، به مولفهای جدایی ناپذیر از فرآیند یادگیری مبدل شدهاند. یک انتخاب ویژگی صحیح میتواند منجر به بهبود یادگیرنده استقرایی از جهتهای ...
افزایش بهره وری و کارآمدی: داده کاوی به صرفه جویی در زمان و منابع کمک میکند، زیرا به جای تحلیل دستی دادهها، از روشهای خودکار و سریعتر استفاده میشود. داده کاوی همچنین به بهبود ...
در این مطلب به مباحث «داده کاوی» (Data Mining) از صفر تا صد پرداخته شده است. با پیشرفت سریع «فناوری اطلاعات» (Information Technology)، بشر شاهد یک رشد انفجاری در تولید «داده» (Data) و ظرفیتهای گردآوری و ذخیره ...