منبع اصلی نوشتار زیر در این لینک قرار دارد

ارایه با موضوع موتور جستجوری توزیع‌شده یاسی

چند وقت پیش توی لاگ مشهد یک ارایه با موضوع موتور جستجوی توزیع شده یاسی (Yacy) داشتم. اسلاید‌های این ارایه رو می‌تونید اینجا ببینید و در صورت نیاز دانلود کنید. ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

سیستم پردازش برداری متون

در واقع هیچ لغتی بدون در نظر گرفتن همسایگی هایش معنی خاصی ندارد. وقتی ما از یک کلمه یاد میکنیم، تجربه این همسایگی هاست که معنی های مختلف آن کلمه را برای ما تعیین میکند. در روش برداری کلامت اولین گام نسبت دادن مقدار عددی به هر یک از کلمات است.
در این روش هر کلمه ماتریسی از نسبت های کلمه در جمله و … خواهد بود و هر جا که کلمه استفاده بشود این ماتریس در حقیقت مقدار مترادف کلمه خواهد بود. به صورت مشخص اولین نتیجه گیری ای که از این روش میشود انجام داد به این صورت است که کلماتی که معنی نزدیک هم دارند چون در شرایط مشخص استفاده میشوند اعداد نزدیک به هم پیدا میکنند و به راحتی مترادفین قابل دستیابی است. البته شاید هم ارزش کلمه بهتری به جای مترادف باشد
در گام دوم نسبت های کلمات در این روش قابل جمع و کسر است. یعنی تفاضل عددی دو کلمه مقداری معنی دار است که نتیجه گیری های مختلفی میشود انجام داد.
مثلا نسبت بین ایران به تهران برابر نسبت عراق به بغداد است
یا نسبت معلم به شاگرد مثل نسبت افلاطون به ارسطوست

طبیعتا دیتابیس هایی که برای مشخص کردن این نسبت ها استفاده میشود در صورت یکه بودن قابلیت مشخص کردم رسم الخط را نیز فراهم میکند. یعنی مشخص میکند این جمله در این ادبیات چقدر قابل ارایه است. از طرفی امکان ارایه جمله یا قانون جدید در ادبیات مشخص وجود دارد. به طور مثال با خواندن فرهنگ ارسطویی میتوانید یک قانون جدید را مطرح کنید و نسبت درستی این مطلب به نسبت ادبیات زبانی را مشخص کنیم.

این روش به طور کلی از روش های مدل پنهان مارکوف است که در این حالت حلقه گرافی تاثیر مستقیمی ندارد. در این روش شما با عددی که train شده است هر گونه پردازشی میکنید. البته ترکیب این ادبیات با روش های شبکه عصبی نتیجه های جالب تری خواهد دارد که در مدل های دیگر مطرح خواهد شد

نمونه خروجی های این سیستم
رابطه کلی
پایتخت + ایران -> تهران
کشور + میهن -> ایران
پدر +‌ گوساله -> گاو

رابطه نسبتی
کرمان – رفسنجان + اردکان -> یزد
برانکو – پرسپولیس + استقلال -> منصوریان
تهران – ایران + انگلیس -> لندن
روحانی – ایران + ترکیه -> اردوغان

 

این رابطه ها قابلیت بهبود زیادی دارند و تمام بررسی ها بر پایه ویکی پوده است.

ادامه مطلب

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

رادیو گیک شماره ۶۴ – بازگشت به دوران طلایی هکرها

این شماره از رادیو گیک نه فقط پر است از هک، بلکه در دو مورد چیزهایی رو به شما می گه که چند سال بتونین بگین «اوه.. اینو تو رادیوم گفته بود قبلا!». در شماره شصت و چهار این حرکتگاه رادیویی، ما جشن بازگشت دوران طلایی رو می‌گیریم و مطمئن می‌شیم که حتی اگر آرش […] ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

رادیو گیک شماره ۶۲ – در پشتی

در اولین شماره از رادیوگیک در سال ۹۵، در پشتی رو برای ورود به سال جدید انتخاب می کنیم. از هکرها می گیم و دلایلی که مردم باید از دست دولت هاشون در امان باشن. در این شماره آخرین سنگر ما در مقابل کامپیوترها فروریخته! متاسفانه براوزر شما از اچ تی ام ال ۵ پشتیبانی […] ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

آیا مایکروسافت در حال اضافه کردن زیرسیستم‌های لینوکسی به ویندوز است؟

همین چند ماه قبل بود که مایکروسافت اعلام کرد با لینوکس دوست است و فکر کنم توی رادیو گیک ازش حرف زدیم. همچنین کلی خبر داشتیم مثل توسعه سیستم لینوکسی برای آژر و استفاده از اوبونتو برای سرویس‌های بیگ دیتا در مایکروسافت. حالا یک هکر ویندوزی به اسم مستعار walkingCat خبر عجیبی رو منتشر کرده: […] ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

رادیو گیک شماره ۶۰ – پسا تفعیل

بابلی‌ها و سومری‌هایی است در ۵۵۰۰ سال قبل سیستم سگزادسیمال (شصت شصتی) رو پایه گذاشتن و باعث شدن دقیقه ما شصت ثانیه داشته باشه و معتقد باشیم سر یک جغد صد و هشتاد در جه می‌چرخه. در شماره شصتم رادیو گیک،‌ برای کمتر از یکساعت که بهش می گیم شصت دقیقه، مهمان رادیویی هستیم که […] ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

رادیو گیک شماره ۵۵ – جادی جاج کن که جاجت…

در این شماره جاج می کنیم. به آدم های بد می گیم بد و به کسانی که اشتباه می کنن می گیم اشتباه می کنن! عقیده سانسور اینجا محترم نیست! می بینیم که آیا باید از هوش مصنوعی ترسید و آیا ربات های تلگرام می تونن گربه های خونگی ما رو به قتل برسونن؟ با […] ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

رادیو گیک شماره ۵۳ – بیگ دیتا، دانشمندان داده و برگشت دایناسورها

ما روزانه ۲.۵ کویینتیلیون بایت دیتا درست می کنیم… اگر نمی دونین کویینتیلیون چقدره بذارین این شکلی بگم: نود درصد کل دیتایی که در جهان هست، در دو سال گذشته تولید شده! سیگنال های جی پی اس، سوشیال مدیا،‌ کلیک‌ها، سنسورها، ویدئوها، عکسها، خریدها، خوش اومدن ها، رفتارها و هر چیزی که فکرش رو بکنین […] ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

آشنایی با بیت کوین

مدتی پیش ارائه‌ای توی جلسه باز نرم‌افزاری مشهد ارائه‌آی در مورد بیت‌کوین داشتم. در این ارائه مفاهیم مقابل به عنوان پیش نیاز آشنایی با بیت‌کوین بررسی شد:پول ، پول فیات، شرایط پول و دلیل اعتماد به بیت‌کوین به عنوان پول … ادامه‌ی خواندن
ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

تنگنایی در شبکه تور که ممکن است باعث از دسترس خارج شدن شبکه شود

در ساختار شبکه تور ده عدد سروربه نام Directory Authorities و یا directory node داریم که این سرورها لیست همه نودهای شبکه را نگهداری می‌کنند آدرس و مشخصات این نودها در کلاینت تور به صورت hardcode (تنها با تغییر در … ادامه‌ی خواندن
ادامه مطلب