دانلود مقاله

توضیحات محصول

دانلود مقاله تولید شیوه های طبقه بندی متن کارآمد

تعداد کلمات فایل انگلیسی:2874 کلمه 5صفحه pdf

تعداد صفحات فایل ترجمه:8صفحه word فونت14 Arial

چکیده

این مقاله یک رویکرد ساده و کارآمد را برای طبقه بندی متن و شیوه بیان و ارائه آن پیشنهاد می کند. تحقیقات ما نشان می دهد که طبقه بندی سریع متن fastText اغلب در مقایسه با طبقه بندی های یادگیری عمیق از لحاظ دقت و بسیاری از دستورات برای آموزش و ارزیابی سریع تر است. می توان  fastText را با بیش از یک میلیارد کلمه و با استفاده از یک CPU چند هسته ای استاندارد آموزش داد  و  می توانید تقریباً نیم میلیون جمله را در دسته های 312K در کمتر از یک دقیقه طبقه بندی کنید.

. مقدمه

شیوه بیان و ارائه مناسب برای طبقه بندی متن یک کار مهم است و با بسیاری از برنامه های کاربردی مانند مرورگر وب، بازیابی اطلاعات، رتبه بندی و طبقه بندی اسناد در ارتباط است (Deerwester  و همکاران  1990؛ Pang  و  Lee، 2008). به تازگی، مدل های مبتنی بر شبکه برای شیوه بیان و ارائه مناسب  رایج شده است (Bengio  و همکاران  2003؛ Collobert and Weston، 2008). در حالی که این مدل ها عملکرد بسیار خوبی  دارند (Kim، 2014؛ ژانگ و LeCun، 2015؛ ژانگ و همکاران، 2015)، با این وجود  استفاده از آنها در مجموعه داده های بسیار بزرگ باعث  محدودیت می شود.

Bag of Tricks for Efficient Text Classification

abstract

This paper proposes a simple and efficient ap- proach for text classification and representa- tion learning. Our experiments show that our fast text classifier fastText is often on par with deep learning classifiers in terms of ac- curacy, and many orders of magnitude faster for training and evaluation. We can train fastText on more than one billion words in less than ten minutes using a standard mul- ticore CPU, and classify half a million sen- tences among 312K classes in less than a minute.

 

 Introduction

Building good representations for text classi- fication is an important task with many ap- plications, such as web search, information retrieval,   ranking   and   document   classifica- tion (Deerwester et al., 1990; Pang and Lee, 2008). Recently, models based on neural networks have become increasingly popular for computing sentence representations (Bengio et al., 2003; Collobert and Weston, 2008).      While these models achieve very  good  performance  in practice (Kim, 2014; Zhang and LeCun, 2015; Zhang et al., 2015), they tend to be relatively slow both at train and test time, limiting their use on very large datasets

 کد:1-12290

دانلود رایگان فایل انگلیسی:

رمز فایل:www.downloadmaghaleh.com

نظری بدهید

چهار × چهار =