خوشه بندی داده ها

معنی کلمه خوشه بندی داده ها در فرهنگستان زبان و ادب

{data clustering} [رایانه و فنّاوری اطلاعات] دسته بندی مجموعه ای از داده ها براساس روابط آنها

جملاتی از کاربرد کلمه خوشه بندی داده ها

میتوان استفاده های دیگری نیز کرد، برای اینکه ببینیم داده هایمان در خوشه بندی چقدر نزدیک هستند یا برای اینکه ببینیم مدلمان چقدر خوشه بندی را به درستی انجام داده و برای انتخاب بهترین تعداد خوشه ها.
خوشه بندی براساس اتصال، که همچنین به عنوان خوشه‌بندی سلسله‌مراتبی شناخته می‌شود، بر مبنای ایده اصلی اشیائی است که بیشتر مربوط به اشیای نزدیک، نسبت به اشیاء دورتر است. این الگوریتم‌ها «اشیا» را برای ایجاد «خوشه‌ها» بر اساس فاصلهٔ آن‌ها متصل می‌کنند. خوشه را می‌توان به طورکلی با حداکثر فاصله مورد نیاز برای اتصال قطعات خوشه توصیف کرد. در فاصله‌های مختلف، خوشه‌های متفاوتی شکل می‌گیرند که می‌تواند با استفاده از یک دندروگرام نشان داده شود، که توضیح می‌دهد که نام معمول «خوشه‌بندی سلسله‌مراتبی» از آن می‌آید: این الگوریتم‌ها یک پارتیشن‌بندی مجموعه داده را ارائه نمی‌دهند، بلکه یک سلسله‌مراتب گسترده‌ای از خوشه‌هایی که در فاصله‌های معینی با یکدیگر ادغام می‌شوند، ارائه می‌دهد. در یک دندروگرام محور y نشان‌دهندهٔ فاصله‌ای است که خوشه‌ها ادغام می‌کنند، در حالی که اشیاء در امتداد محور x قرار می‌گیرند به طوری که خوشه‌ها با هم مخلوط نمی‌شوند.
تجمع خانواده همچنین شناخته شده به عنوان تجمع خانوادگی است که خوشه بندی برخی از صفات ورفتارها یا اختلالات در درون یک خانواده است. تجمع خانواده ممکن است به دلیل تشابهات ژنتیکی یا محیطی به وجود می‌آیند
در مطالعه شبکه‌های اجتماعی، خوشه بندی ممکن است برای تشخیص ارتباط جوامع در گروه‌های بزرگ مردم استفاده شود.
همچنین، طراحی قفل توپی باعث سهولت و روانی نصب بست کمربندی استینلس استیل می شود. با توجه به عمر بسیار بالای این نوع بست ها، استفاده از آن جهت خوشه بندی دراز مدت کابل ها، لوله ها، و شیلنگ ها توصیه می گردد. همچنین، مقاومت کششی بالای بست های استینلس استیل، قدرت و امنیت را جهت خوشه بندی اجسام سنگین تضمین می کند.
در حقیق ۳ جزء اصلی هستند که خوشه بندی محتوا را شکل می‌دهند.
۱.شروع خوشه بندی با در نظر گرفتن سطح L (0) = ۰ و شماره‌های متوالی m = ۰.
تعداد خوشه‌ها معیار و ملاک خوشه بندی و اینکه کدام خوشه بندی مطلوب تر است بسته به الگوریتم و هدف ما است.
شاخص رند اینکه خوشه‌ها (که توسط الگوریتم خوشه بندی بازمی‌گردند) به معیار طبقه‌بندی‌ها چقدر شبیه‌اند را محاسبه می‌کند. همچنین می‌توانید شاخص رند را به عنوان اندازه‌گیری درصد تصمیمات درست که توسط الگوریتم ساخته شده‌است را استفاده کرد. که می‌توان با استفاده از فرمول زیر محاسبه کرد:
بیش از دوازده اندازه‌گیری ارزیابی داخلی وجود دارد. به عنوان مثال، برای ارزیابی کیفیت خوشه بندی می‌توان از روش‌های زیر استفاده کرد.