دانلود مقاله تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)
تعداد کلمات فایل انگلیسی:2800 کلمه 8 صفحه pdf
تعداد صفحات فایل ترجمه:10 صفحه word فونت 11 B Nazanin
تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)
دسته بندی متون بر اساس استراتژی ادغام و تفکیک
چکیده
الگوریتم دسته بندی یا خوشه بندی متون بر نقطه ضعف روش های تفکیک متون که مبنی بر روش های خوشه بندی روی حساسیت تعداد کلاس های تخمین زده بود غلبه کرده اند . ویژگی های پیچیده ء یک کلمه همچون مترادف ها و کلمات مرکب فضای مطالعات را معنادار تر کرده اند . استراتژی تفکیک و ادغام تعداد بیشماری از دسته های کلمات را پوشش می دهد . نتایج تجربی نشان می دهند که تعداد مراکز ِ به روز شده به طور اساسی از اعوجاج خوشه های حاصل زمانی که به اندازه ء K از مقدار درجه ء اصلی انحراف داشته باشد ، جلوگیری می کند . وقتی که K خیلی کوچک و یا خیلی بزرگ باشد تفاضل خوشه های حاصل بین میانگین های FC-DM و K بسیار واضح بوده و FC-DM هم معیارهای الگوریتم های دیگر را بهتر می کند .
Text clustering based on a divide and merge strategy
Abstract
A text clustering algorithm is proposed to overcome the drawback of division based clustering method on sensitivity of estimated class number. Complex features including synonym and co-occurring words are extracted to make a feature space containing more semantic information. Then the divide and merge strategy helps the iteration converge to a reasonable cluster number. Experimental results showed that the dynamically updated center number prevent the deterioration of clustering result when k deviates from the real class numbers. When k is too small or large, the difference of clustering results between FC-DM and k-means is more obvious and FC-DM also outperformed other benchmark algorithms
Keywords: Text clustering, feature extension, k-means
کد:12919
دانلود رایگان فایل انگلیسی:
رمز فایل:www.downloadmaghaleh.com

توضیحات محصول
دانلود مقاله تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)
تعداد کلمات فایل انگلیسی:2800 کلمه 8 صفحه pdf
تعداد صفحات فایل ترجمه:10 صفحه word فونت 11 B Nazanin
تکنولوژی اطلاعات و مدیریت کمیت ( ITQM 2015)
دسته بندی متون بر اساس استراتژی ادغام و تفکیک
چکیده
الگوریتم دسته بندی یا خوشه بندی متون بر نقطه ضعف روش های تفکیک متون که مبنی بر روش های خوشه بندی روی حساسیت تعداد کلاس های تخمین زده بود غلبه کرده اند . ویژگی های پیچیده ء یک کلمه همچون مترادف ها و کلمات مرکب فضای مطالعات را معنادار تر کرده اند . استراتژی تفکیک و ادغام تعداد بیشماری از دسته های کلمات را پوشش می دهد . نتایج تجربی نشان می دهند که تعداد مراکز ِ به روز شده به طور اساسی از اعوجاج خوشه های حاصل زمانی که به اندازه ء K از مقدار درجه ء اصلی انحراف داشته باشد ، جلوگیری می کند . وقتی که K خیلی کوچک و یا خیلی بزرگ باشد تفاضل خوشه های حاصل بین میانگین های FC-DM و K بسیار واضح بوده و FC-DM هم معیارهای الگوریتم های دیگر را بهتر می کند .
Text clustering based on a divide and merge strategy
Abstract
A text clustering algorithm is proposed to overcome the drawback of division based clustering method on sensitivity of estimated class number. Complex features including synonym and co-occurring words are extracted to make a feature space containing more semantic information. Then the divide and merge strategy helps the iteration converge to a reasonable cluster number. Experimental results showed that the dynamically updated center number prevent the deterioration of clustering result when k deviates from the real class numbers. When k is too small or large, the difference of clustering results between FC-DM and k-means is more obvious and FC-DM also outperformed other benchmark algorithms
Keywords: Text clustering, feature extension, k-means
کد:12919
دانلود رایگان فایل انگلیسی:
رمز فایل:www.downloadmaghaleh.com