filesell - طراحی صفحات وب
 
» تمامی کالاها و خدمات این فروشگاه ، حسب مورد دارای مجوزهای لازم از مراجع مربوطه میباشند و فعالیتهای این سایت تابع قوانین و مقررات جمهوری اسلامی ایران است .
طراحی صفحات وب مهدی قادری ترنیک 1396/10/04 دسته بندی : موضوعات متفرقه کامپیوتر 0

کامپیوتر 
طراحی صفحات وب 
کاربردهای دسته‌بندی صفحات وب 
ارزیابی الگوریتم‌های دسته‌بندی 

 

دسته‌بندي صفحات وب

چكيده

دسته‌بندي صفحات وب در بسياري از وظيفه‌هاي مديريتي در وب نقش ضروري‌اي دارد. طبيعت غبرقابل کنترل محتواي وب چالش‌هاي جديدي را براي اين دسته بندي ايجاد مي کند اما طبيعت متصل صفحات وب و همچنين حالت نيمه ساخت‌يافته آنها قابليتهايي را فراهم مي کند که به کمک اين دسته‌بندي مي‌آيد. امروزه توسعه زيادي در زمينه دسته‌بندي هوشمند صفحات صورت گرفته است بطوري‌که بسياري از محققين تمرکز خود را بر روي اين قصيه قرار داده اند. در اين مقاله ما رويکردهاي دسته‌بندي صفحات وب را بررسي  مي‌کنيم تا چشم انداز هاي جديدي را براي تحقيات بيابيم. همچنين در ابتدا برخي از کاربردهاي دسته‌بندي صفحات وب را بيان خواهيم نمود. همچنين خصوصيتها و الگوريتمهايي را که براي دسته‌بندي مفيد هستند توضيح خواهيم داد.

 

1- مقدمه

دسته‌بندي در بسياري از وظايف مديريت وبازيابي اطلاعات يک نقش حياتي ايفا مي کند.  در وب دسته‌بندي محتوي صفحات وب براي تمرکز خزيدن، کمک به توسعه راهنماهاي وب، تحليل بر اساس موضوع لينکهاي وب و براي تحليل ساختار موضوعي وب ضروري است. دسته‌بندي صفحات وب همچنين مي تواند به بهبود شرايط جستجوي وب نيز کمک نمايد.

دسته‌بندي صفحات وب که به گروه بندي صفحات وب نيز معروف است عبارتست از فرايند نسبت دادن يک صفحه وب به يک يا چند گروه از پيش تعيين شده. دسته‌بندي اغلب بعنوان يک مسئله يادگيري مطرح مي شود که در آن از يکسري داده هاي برچسب گذاري شده براي آموزش و تمرين دسته‌کننده استفاده مي شود تا بر اساس آن دسته‌کننده بتواند داده ها را برچسب گذاري کند.

 

2- کاربردهاي دسته‌بندي صفحات وب

2-1- ايجاد ، پشتيباني يا توسعه راهنماهاي وب

برخي از سايتها مانند Yahoo! و dmoz ODP يکسري راهنماي وب دارند که بر اساس آن مي توان يکسري جستجو در گروههاي از پيش تعيين شده انجام داد که در حال حاضر اين راهنماها توسط انسان ايجاد مي شوند. در جولاي 2006 در dmoz ODP، 73354 اديتور راهنما وجود داشت. با گسترش روزافزون صفحات وب ديدگاه سنتي به اين قضيه ديگر نمي تواند موثر باشد . اما با استفاده از دسته‌بندي صفحات وب مي توان اين راهنماها را براحتي ايجاد کرد و توسعه داد.

2-2- بهبود کيفيت نتايج جستجو

گنگ بودن پرس و جوها يکي از مشکلات اساسي براي نتايج جستجو مي باشد. بعنوان مثال کلمه bank هم به معني ساحل و هم به معني بانک است. رويکردهاي مختلفي براي بازيابي اطلاعات در اينگونه موارد مطرح گرديده است. Chekuri و گروهش دسته‌بندي اتوماتيک صفحات وب به منظور افزايش دقت جستجو در وب را مورد مطالعه قرار دادند. به يک دسته‌کننده آماري با استفاده از يکسري صفحات موجود آموزش داده شد، سپس اين دسته‌کننده بر روي يکسري صفحات جديد بکار گرفته شد که يک ليست مرتب از گروهها را ايجاد کرد که صفحات وب مي توانند در آن قرار گيرند. در زمان پرس و جو از کاربر خواسته مي شود تا يک يا چند گروه را انتخاب نمايد بطوريکه فقط اطلاعات مربوط به آن گروه‌ها برگردانده مي شوند يا اينکه موتور جستجو فقط يک ليست از گروه‌هايي را نشان مي دهد که اطلاعات مورد نظر در آنها وجود دارد. اما اين رويکرد فقط زماني ثمربخش است که کاربر به دنبال يک چيز معلوم و مشخص بگردد.

 

نتايج جستجو معمولاً بر اساس رتبه بندي نمايش داده مي شوند. يک رويکرد ارائه شده توسط Chen and Damais نتايج جستجو را در يک ساختار سيسله مراتبي از پيش تعيين شده دسته‌بندي مي کند و نتايج گروهبندي شده را نشان مي دهد. مطالعه کاربران آنها نشان مي‌دهد که نمايش گروهي براي کاربران خوشايندتر از نتايج ليست شده است و براي کاربران جهت يافتن اطلاعاتشان موثرتر است. در مقايسه با روش قبل اين روش در زمان پرس و جو اثر کمتري دارد زيرا گروه بندي صفحات در آن بصورت در جا ايجاد مي شود. در هر حال لازم نيست که کاربر گروه‌هاي مورد نظر خود براي جستجو را انتخاب نمايد بنابراين اين روش زماني که کاربر مورد جستجو را دقيقاً نمي‌شناسد بسيار سودمند است.

متشابهاً Kaki نيز نمايش گروهي را براي نتايج جستجوي کاربران پيشنهاد داده است. آزمايشات وي نشان مي دهد که نمايش گروهي براي کاربران بسيار مفيد است مخصوصاً زماني که رتبه بندي نتايج راضي کننده نيست.

Page and Brin الگوريتم رتبه بندي بر اساس لينک[2] را توسعه دادند که Pagerank ناميده شد. در اين روش ميزان معتبر بودن يک صفحه بر اساس يک گراف ايجاد شده از صفحات وب و لينکهايش و بدون در نظر گرفتن موضوع هر صفحه محاسبه مي شود . Haveliwala رتبه‌بندي بر اساس موضوع را ارائه کرد که باعث محاسبه رتبه بندي چندگانه مي شود بطوريکه رتبه بندي براي هر موضوع جداگانه خواهد بود . اين روش نياز به يکسري صفحات دارد که از قبل و با دقت دسته‌بندي شده باشند.

 

فایل پاورپوینت 29 اسلاید


خرید و دانلود | 6,500 تومان
گزارش تخلف به پلیس سایت
مطالب مرتبط