توضیحات محصول

دانلود مقاله مرتب سازی در GPU ها برای مجموعه داده های بزرگ مقیاس: مقایسه کامل

تعداد کلمات فایل انگلیسی: 9000  کلمه  15 صفحه pdf  

تعداد صفحات فایل ترجمه: 40 صفحه word  فونت 14   B  Nazanin

مرتب سازی در GPU ها برای مجموعه داده های بزرگ مقیاس: مقایسه کامل

گرچه مرتب سازی در بسیاری از کارهای تحقیقاتی مطالعه شده است، هنوز دارای چالش است به ویژه اگر پیامدهای تکنولوژی های پردازشگر نوین مانند چندهسته ای ها را بدانیم (به عبارتی GPUها، Cell/BE، چند هسته ای، و غیره). در این مقاله، الگوریتم های مختلف برای مرتب سازی اعداد صحیح در رویه چندپردازشگری را مقایسه کردیم و دوام انها در مجموعه داده های بزرگ مقیاس را مورد بحث قرار دادیم( مانند آنهایی که با موتور جستجو مدیریت شدند). به منظور بهره برداری کامل از توانایی معماری زمینه، ما یک نسخه بهینه از شبکه مرتب کننده در مدل-k طراحی کردیم، مدل محاسباتی نوین که برای لحاظ نمودن تمامی ویژگی های مهم معماری چند هسته ای طراحی شده است. مطابق مدل-k، نقشه برداری شبکه مرتب سازی پیوسته سه جنبه مهم معماوری های چند هسته ای را بهبود بخشیده است، به عبارت دیگر، بهره برداری پردازشگر، و استفاده از پهنای باند حافظه چیپ روشن/ چیپ خاموش. بعلاوه، ما قادریم تا به یک پیچیدگی فضایی Θ (1) برسیم. به طور تجربی راه حل های خود را با تکنیک های صنعتی( به نام های Quiksort و Radixsort) در GPU  ها مقایسه کردیم. همچنین ما پیچیدگی در مدل –k را برای چنین الگوریتم هایی مقایسه کردیم. ارزیابی صورت گرفته تاکید کرد که شبکه مرتب سازی پیوسته ما از Quiksort سریعتر و از radix کندتر است، هنوز به عنوان یک راه حل درجا، نسبت به دو الگوریتم دیگر حافظه کمتری استفاده می کند.

Sorting on GPUs for large scale datasets: A thorough comparison

ABSTRACT

Although sort has been extensively studied in many research works, it still remains a chal­lenge in particular if we consider the implications of novel processor technologies such as manycores (i.e. GPUs, Cell/BE, multicore, etc.). In this paper, we compare different algo­rithms for sorting integers on stream multiprocessors and we discuss their viability on large datasets (such as those managed by search engines). In order to fully exploit the potentiality of the underlying architecture, we designed an optimized version of sorting network in the K-model, a novel computational model designed to consider all the impor­tant features of many-core architectures. According to K-model, our bitonic sorting net­work mapping improves the three main aspects of many-core architectures, i.e. the processors exploitation, and the on-chip/off-chip memory bandwidth utilization. Further­more we are able to attain a space complexity of H(1). We experimentally compare our solution with state-of-the-art ones (namely, Quicksort and Radixsort) on GPUs. We also compute the complexity in the K-model for such algorithms. The conducted evaluation highlight that our bitonic sorting network is faster than Quicksort and slightly slower than radix, yet being an in-place solution it consumes less memory than both algorithms

Keywords:

Stream programming Graphical processor unit Bitonic sorting network Computational model

دانلود مقاله مرتب سازی در GPU ها برای مجموعه داده های بزرگ مقیاس: مقایسه کامل

دانلود مقاله مرتب سازی در GPU ها برای مجموعه داده های بزرگ مقیاس: مقایسه کامل

دانلود مقاله مرتب سازی در GPU ها برای مجموعه داده های بزرگ مقیاس: مقایسه کامل

کد:9198

دانلود رایگان مقاله انگلیسی

دانلود مقاله مرتب سازی در GPU ها برای مجموعه داده های بزرگ مقیاس: مقایسه کامل

نظری بدهید

دو × 2 =