ایندکس چیست ؟
ایندکس چیست ؟
برای سرچ در فایل های بزرگ از روش ایندکس گذاری استفاده میکنیم.
جمله بالا یعنی چی ؟
فرض کن کلمه علی در صفحات 5 و 100 و 200 یک کتاب آورده شده است. بجای اینکه هر دفعه در فایل اصلی دنبال علی بگردیم با پیچیدگی زمانی یک میرویم سراغ فایل ایندکس و می فهمیم کلمه علی در چه صفحاتی آورده شده است و اون صفحات را به کاربر نمایش می دهیم.
لایبراری آپاچی لوسین چیست و در این زمینه چه کاربردی دارد؟
یک لایبرای جاوایی است که بهش ورودی میدی , این ورودی میتونه فایل متنی باشه , فایل اکسل باشه و یا یک جدول و این لایبراری میره باهاش یک فایل ایندکس میسازه. و موقع سرچ بجای اینکه فایل اصلی رو درگیر کنه میره سراغ فایل ایندکس و اینجوری سرعت پرس و جو ها به نحو چشمگیری افزایش پیدا میکنه
الاستیک سرچ چیست و چه کاربردی دارد ؟
فرض کنید فایل ایندکس خیلی بزرگ بشه دوباره سرچ کردن روی خود فایل ایندکس هم زمانبره واسه همین فایل های ایندکس خیلی بزرگ رو به فایل های ایندکس کوچکتر تقسیم می کنند تا بتونن بطور موازی روی اونا سرچ انجام بدن.
هسته و اساس الاستیک سرچ همون لایبراری آپاچی لوسین می باشد و فرقش با لوسین تو اینه که مدیریت فایل های ایندکس با خودشه.
هدف از دادن فایل های ایندکس لوسین و الاستیک سرچ به کلان داده چیست؟
لوسین و الاستیک سرچ میتونن به تنهایی کار کنن ولی به منظور افزایش کارایی میتونیم این فایل ها را به هدوپ منتقل کنیم تا از مدل پردازش map/reduce جهت افزایش کارایی استفاده کنیم.
البته دقت کنین که این ایندکس ها از نوع اینورتد ایدکس می باشند یعنی کلید این ایندکس یک کلمه است و مقدار آن یک عدد می باشد
با تشکر از مقالات مفید دکتر جلالدین نصیری (کارشناس ارشد تشخیص تقلب)
امیر حسین میثمی