چند وقت پیش توی لاگ مشهد یک ارایه با موضوع موتور جستجوی توزیع شده یاسی (Yacy) داشتم. اسلایدهای این ارایه رو میتونید اینجا ببینید و در صورت نیاز دانلود کنید. ادامه مطلب
ارایه با موضوع موتور جستجوری توزیعشده یاسی
16
04
16
04
چند وقت پیش توی لاگ مشهد یک ارایه با موضوع موتور جستجوی توزیع شده یاسی (Yacy) داشتم. اسلایدهای این ارایه رو میتونید اینجا ببینید و در صورت نیاز دانلود کنید. ادامه مطلب
21
01
در واقع هیچ لغتی بدون در نظر گرفتن همسایگی هایش معنی خاصی ندارد. وقتی ما از یک کلمه یاد میکنیم، تجربه این همسایگی هاست که معنی های مختلف آن کلمه را برای ما تعیین میکند. در روش برداری کلامت اولین گام نسبت دادن مقدار عددی به هر یک از کلمات است.
در این روش هر کلمه ماتریسی از نسبت های کلمه در جمله و … خواهد بود و هر جا که کلمه استفاده بشود این ماتریس در حقیقت مقدار مترادف کلمه خواهد بود. به صورت مشخص اولین نتیجه گیری ای که از این روش میشود انجام داد به این صورت است که کلماتی که معنی نزدیک هم دارند چون در شرایط مشخص استفاده میشوند اعداد نزدیک به هم پیدا میکنند و به راحتی مترادفین قابل دستیابی است. البته شاید هم ارزش کلمه بهتری به جای مترادف باشد
در گام دوم نسبت های کلمات در این روش قابل جمع و کسر است. یعنی تفاضل عددی دو کلمه مقداری معنی دار است که نتیجه گیری های مختلفی میشود انجام داد.
مثلا نسبت بین ایران به تهران برابر نسبت عراق به بغداد است
یا نسبت معلم به شاگرد مثل نسبت افلاطون به ارسطوست
طبیعتا دیتابیس هایی که برای مشخص کردن این نسبت ها استفاده میشود در صورت یکه بودن قابلیت مشخص کردم رسم الخط را نیز فراهم میکند. یعنی مشخص میکند این جمله در این ادبیات چقدر قابل ارایه است. از طرفی امکان ارایه جمله یا قانون جدید در ادبیات مشخص وجود دارد. به طور مثال با خواندن فرهنگ ارسطویی میتوانید یک قانون جدید را مطرح کنید و نسبت درستی این مطلب به نسبت ادبیات زبانی را مشخص کنیم.
این روش به طور کلی از روش های مدل پنهان مارکوف است که در این حالت حلقه گرافی تاثیر مستقیمی ندارد. در این روش شما با عددی که train شده است هر گونه پردازشی میکنید. البته ترکیب این ادبیات با روش های شبکه عصبی نتیجه های جالب تری خواهد دارد که در مدل های دیگر مطرح خواهد شد
نمونه خروجی های این سیستم
رابطه کلی
پایتخت + ایران -> تهران
کشور + میهن -> ایران
پدر + گوساله -> گاو
رابطه نسبتی
کرمان – رفسنجان + اردکان -> یزد
برانکو – پرسپولیس + استقلال -> منصوریان
تهران – ایران + انگلیس -> لندن
روحانی – ایران + ترکیه -> اردوغان
این رابطه ها قابلیت بهبود زیادی دارند و تمام بررسی ها بر پایه ویکی پوده است.
13
06
این شماره از رادیو گیک نه فقط پر است از هک، بلکه در دو مورد چیزهایی رو به شما می گه که چند سال بتونین بگین «اوه.. اینو تو رادیوم گفته بود قبلا!». در شماره شصت و چهار این حرکتگاه رادیویی، ما جشن بازگشت دوران طلایی رو میگیریم و مطمئن میشیم که حتی اگر آرش […] ادامه مطلب
30
03
در اولین شماره از رادیوگیک در سال ۹۵، در پشتی رو برای ورود به سال جدید انتخاب می کنیم. از هکرها می گیم و دلایلی که مردم باید از دست دولت هاشون در امان باشن. در این شماره آخرین سنگر ما در مقابل کامپیوترها فروریخته! متاسفانه براوزر شما از اچ تی ام ال ۵ پشتیبانی […] ادامه مطلب
04
02
همین چند ماه قبل بود که مایکروسافت اعلام کرد با لینوکس دوست است و فکر کنم توی رادیو گیک ازش حرف زدیم. همچنین کلی خبر داشتیم مثل توسعه سیستم لینوکسی برای آژر و استفاده از اوبونتو برای سرویسهای بیگ دیتا در مایکروسافت. حالا یک هکر ویندوزی به اسم مستعار walkingCat خبر عجیبی رو منتشر کرده: […] ادامه مطلب
25
01
بابلیها و سومریهایی است در ۵۵۰۰ سال قبل سیستم سگزادسیمال (شصت شصتی) رو پایه گذاشتن و باعث شدن دقیقه ما شصت ثانیه داشته باشه و معتقد باشیم سر یک جغد صد و هشتاد در جه میچرخه. در شماره شصتم رادیو گیک، برای کمتر از یکساعت که بهش می گیم شصت دقیقه، مهمان رادیویی هستیم که […] ادامه مطلب
27
08
در این شماره جاج می کنیم. به آدم های بد می گیم بد و به کسانی که اشتباه می کنن می گیم اشتباه می کنن! عقیده سانسور اینجا محترم نیست! می بینیم که آیا باید از هوش مصنوعی ترسید و آیا ربات های تلگرام می تونن گربه های خونگی ما رو به قتل برسونن؟ با […] ادامه مطلب
22
06
ما روزانه ۲.۵ کویینتیلیون بایت دیتا درست می کنیم… اگر نمی دونین کویینتیلیون چقدره بذارین این شکلی بگم: نود درصد کل دیتایی که در جهان هست، در دو سال گذشته تولید شده! سیگنال های جی پی اس، سوشیال مدیا، کلیکها، سنسورها، ویدئوها، عکسها، خریدها، خوش اومدن ها، رفتارها و هر چیزی که فکرش رو بکنین […] ادامه مطلب
13
03
مدتی پیش ارائهای توی جلسه باز نرمافزاری مشهد ارائهآی در مورد بیتکوین داشتم. در این ارائه مفاهیم مقابل به عنوان پیش نیاز آشنایی با بیتکوین بررسی شد:پول ، پول فیات، شرایط پول و دلیل اعتماد به بیتکوین به عنوان پول … ادامهی خواندن→
ادامه مطلب
24
12
در ساختار شبکه تور ده عدد سروربه نام Directory Authorities و یا directory node داریم که این سرورها لیست همه نودهای شبکه را نگهداری میکنند آدرس و مشخصات این نودها در کلاینت تور به صورت hardcode (تنها با تغییر در … ادامهی خواندن→
ادامه مطلب