دانلود مقاله علمی

توضیحات محصول

دانلود مقاله تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)

تعداد کلمات فایل انگلیسی:2800 کلمه 8 صفحه pdf

تعداد صفحات فایل ترجمه:10 صفحه word فونت 11 B Nazanin

تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)

دسته بندی متون بر اساس استراتژی ادغام و تفکیک

چکیده

الگوریتم دسته بندی یا خوشه بندی متون بر نقطه ضعف روش های تفکیک متون که مبنی بر روش های خوشه بندی روی حساسیت تعداد کلاس های  تخمین زده بود  غلبه کرده اند  . ویژگی های پیچیده ء یک کلمه همچون مترادف ها و کلمات مرکب  فضای مطالعات را معنادار تر کرده اند  . استراتژی تفکیک و ادغام تعداد بیشماری از دسته های کلمات را پوشش می دهد . نتایج تجربی نشان می دهند که تعداد مراکز ِ به روز شده به طور اساسی از اعوجاج خوشه های حاصل زمانی که به اندازه ء K از مقدار درجه ء اصلی انحراف داشته باشد  ، جلوگیری می کند . وقتی که K خیلی کوچک و یا خیلی بزرگ باشد تفاضل خوشه های حاصل بین میانگین های FC-DM و K بسیار واضح بوده و FC-DM هم معیارهای الگوریتم های دیگر را بهتر می کند .

Text clustering based on a divide and merge strategy

Abstract

A text clustering algorithm is proposed to overcome the drawback of division based clustering method on sensitivity of estimated class number. Complex features including synonym and co-occurring words are extracted to make a feature space containing more semantic information. Then the divide and merge strategy helps the iteration converge to a reasonable cluster number. Experimental results showed that the dynamically updated center number prevent the deterioration of clustering result when k deviates from the real class numbers. When k is too small or large, the difference of clustering results between FC-DM and k-means is more obvious and FC-DM also outperformed other benchmark algorithms

Keywords: Text clustering, feature extension, k-means

کد:12919

دانلود رایگان فایل انگلیسی:

رمز فایل:www.downloadmaghaleh.com

دانلود مقاله تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)

نظری بدهید

شانزده − 11 =