دانلود مقاله ارزیابی تمرین پذیری برچسب گذاری محافظت نشده محتوای سمعی و بصری در محیط تولید بایگانی
تعداد کلمات فایل انگلیسی:2500 کلمه6صفحه pdf
تعداد صفحات فایل ترجمه:6صفحه word فونت14 Arial
چکیده. در این مقاله ما ارزیابی برچسب گذاری محافظت نشده محتوای صمعی و بصری، با استفاده از منابع داده های متنی جایگزین را برای بررسی چگونگی چنین رویکردی که می تواند نتایج قابل قبول را با توجه نیازهای ارائه شده با توجه به کیفیت قابل بایگانی، اقتدار و سطح خدمات برای کاربران خارجی، ارائه دهد، گزارش می کنیم. ما نتیجه گرفتیم که با تنظیمات پارامتر که با استفاده از ارزیابی دقیق و صحیح، بهینه سازی شده اند، کیفیت پیشنهاد واژه خودکار به اندازه کافی بالا است. اجرای این روش در جریان کار تولید ما، به ما اجازه می دهد، به تدریج، سیستم را توسعه دهیم و همچنین تاثیر تغییرات را از فرم دستی به صورت خودکار از دیدگاه کاربر نهایی بررسی کنیم. کار آینده اضافی بر استقرار منابع اطلاعاتی مختلف، از جمله حاشیه نویسی بر اساس تجزیه و تحلیل ویدئویی چند مدلی مانند تشخیص بلندگو و دید رایانه، تمرکز دارد.
- مقدمه
به طور سنتی، محتوای سمعی و بصری در کتابخانه های دیجیتال که به صورت دستی برچسب گذاری می شود، معمولا از واژگان کنترل شده و ساختار یافته یا اصطلاحنامه های خاص دامنه، استفاده می کند. از دیدگاه بایگانی، این یک مدل پایدار نیست که موارد زیر را ارائه می دهد 1) مقدار فزاینده ای از محتوای سمعی و بصری که کتابخانه های دیجیتالی از آن استفاده می کنند (دیدگاه کمی)، و 2) تاکید رو به رشد بر بهبود فرصت های دسترسی برای این داده ها (دیدگاه کیفی). دومی نه تنها در زمینه جستجوی سنتی، بلکه به طور فزاینده ای در زمینه ارتباط، در داخل و در طول مجموعه ها، کتابخانه ها و رسانه ها به کار رفته است. در نهایت، جستجو و ارتباط، از یک منظر سطح سندی، به یک دیدگاه سطح بخشی، تبدیل می شود که در آن، بخش ها به عنوان رسانه های فردی، قابل اتصال هستند. در این زمینه، روند سنتی و برچسب گذاری دستی، نیاز به تجدید نظر دارد تا کمیت و کیفیت برچسب ها را افزایش دهد.
Practice-Oriented Evaluation of Unsupervised Labeling of Audiovisual Content in an Archive Production Environment
Abstract. In this paper we report on an evaluation of unsupervised labeling of audiovisual content using collateral text data sources to inves- tigate how such an approach can provide acceptable results given require- ments with respect to archival quality, authority and service levels to external users. We conclude that with parameter settings that are opti- mized using a rigorous evaluation of precision and accuracy, the quality of automatic term-suggestion are sufficiently high. Having implemented the procedure in our production work-flow allows us to gradually develop the system further and also assess the effect of the transformation from manual to automatic from an end-user perspective. Additional future work will be on deploying different information sources including anno- tations based on multimodal video analysis such as speaker recognition and computer vision.
Introduction
Traditionally, audiovisual content in digital libraries is being labeled manually, typically using controlled and structured vocabularies or domain specific the- sauri. From an archive perspective, this is not a sustainable model given (i) the increasing amounts of audiovisual content that digital libraries ingest (quantita- tive perspective), and (ii) a growing emphasis on improving access opportunities for these data (qualitative perspective). The latter is not only addressed in the context of traditional search, but increasingly in the context of linking within and across collections, libraries, and media. Ultimately, search and linking is shifting from a document-level perspective towards a segment-level perspective in which segments are regarded as individual, ‘linkable’ media-objects. In this context, the traditional, manual labeling process requires revision to increase both quantity and quality of labels
کد:12558
دانلود رایگان فایل انگلیسی:
رمز فایل:www.downloadmaghaleh.com

توضیحات محصول
دانلود مقاله ارزیابی تمرین پذیری برچسب گذاری محافظت نشده محتوای سمعی و بصری در محیط تولید بایگانی
تعداد کلمات فایل انگلیسی:2500 کلمه6صفحه pdf
تعداد صفحات فایل ترجمه:6صفحه word فونت14 Arial
چکیده. در این مقاله ما ارزیابی برچسب گذاری محافظت نشده محتوای صمعی و بصری، با استفاده از منابع داده های متنی جایگزین را برای بررسی چگونگی چنین رویکردی که می تواند نتایج قابل قبول را با توجه نیازهای ارائه شده با توجه به کیفیت قابل بایگانی، اقتدار و سطح خدمات برای کاربران خارجی، ارائه دهد، گزارش می کنیم. ما نتیجه گرفتیم که با تنظیمات پارامتر که با استفاده از ارزیابی دقیق و صحیح، بهینه سازی شده اند، کیفیت پیشنهاد واژه خودکار به اندازه کافی بالا است. اجرای این روش در جریان کار تولید ما، به ما اجازه می دهد، به تدریج، سیستم را توسعه دهیم و همچنین تاثیر تغییرات را از فرم دستی به صورت خودکار از دیدگاه کاربر نهایی بررسی کنیم. کار آینده اضافی بر استقرار منابع اطلاعاتی مختلف، از جمله حاشیه نویسی بر اساس تجزیه و تحلیل ویدئویی چند مدلی مانند تشخیص بلندگو و دید رایانه، تمرکز دارد.
به طور سنتی، محتوای سمعی و بصری در کتابخانه های دیجیتال که به صورت دستی برچسب گذاری می شود، معمولا از واژگان کنترل شده و ساختار یافته یا اصطلاحنامه های خاص دامنه، استفاده می کند. از دیدگاه بایگانی، این یک مدل پایدار نیست که موارد زیر را ارائه می دهد 1) مقدار فزاینده ای از محتوای سمعی و بصری که کتابخانه های دیجیتالی از آن استفاده می کنند (دیدگاه کمی)، و 2) تاکید رو به رشد بر بهبود فرصت های دسترسی برای این داده ها (دیدگاه کیفی). دومی نه تنها در زمینه جستجوی سنتی، بلکه به طور فزاینده ای در زمینه ارتباط، در داخل و در طول مجموعه ها، کتابخانه ها و رسانه ها به کار رفته است. در نهایت، جستجو و ارتباط، از یک منظر سطح سندی، به یک دیدگاه سطح بخشی، تبدیل می شود که در آن، بخش ها به عنوان رسانه های فردی، قابل اتصال هستند. در این زمینه، روند سنتی و برچسب گذاری دستی، نیاز به تجدید نظر دارد تا کمیت و کیفیت برچسب ها را افزایش دهد.
Practice-Oriented Evaluation of Unsupervised Labeling of Audiovisual Content in an Archive Production Environment
Abstract. In this paper we report on an evaluation of unsupervised labeling of audiovisual content using collateral text data sources to inves- tigate how such an approach can provide acceptable results given require- ments with respect to archival quality, authority and service levels to external users. We conclude that with parameter settings that are opti- mized using a rigorous evaluation of precision and accuracy, the quality of automatic term-suggestion are sufficiently high. Having implemented the procedure in our production work-flow allows us to gradually develop the system further and also assess the effect of the transformation from manual to automatic from an end-user perspective. Additional future work will be on deploying different information sources including anno- tations based on multimodal video analysis such as speaker recognition and computer vision.
Introduction
Traditionally, audiovisual content in digital libraries is being labeled manually, typically using controlled and structured vocabularies or domain specific the- sauri. From an archive perspective, this is not a sustainable model given (i) the increasing amounts of audiovisual content that digital libraries ingest (quantita- tive perspective), and (ii) a growing emphasis on improving access opportunities for these data (qualitative perspective). The latter is not only addressed in the context of traditional search, but increasingly in the context of linking within and across collections, libraries, and media. Ultimately, search and linking is shifting from a document-level perspective towards a segment-level perspective in which segments are regarded as individual, ‘linkable’ media-objects. In this context, the traditional, manual labeling process requires revision to increase both quantity and quality of labels
کد:12558
دانلود رایگان فایل انگلیسی:
رمز فایل:www.downloadmaghaleh.com