منبع اصلی نوشتار زیر در این لینک قرار دارد

سیستم پردازش برداری متون

در واقع هیچ لغتی بدون در نظر گرفتن همسایگی هایش معنی خاصی ندارد. وقتی ما از یک کلمه یاد میکنیم، تجربه این همسایگی هاست که معنی های مختلف آن کلمه را برای ما تعیین میکند. در روش برداری کلامت اولین گام نسبت دادن مقدار عددی به هر یک از کلمات است.
در این روش هر کلمه ماتریسی از نسبت های کلمه در جمله و … خواهد بود و هر جا که کلمه استفاده بشود این ماتریس در حقیقت مقدار مترادف کلمه خواهد بود. به صورت مشخص اولین نتیجه گیری ای که از این روش میشود انجام داد به این صورت است که کلماتی که معنی نزدیک هم دارند چون در شرایط مشخص استفاده میشوند اعداد نزدیک به هم پیدا میکنند و به راحتی مترادفین قابل دستیابی است. البته شاید هم ارزش کلمه بهتری به جای مترادف باشد
در گام دوم نسبت های کلمات در این روش قابل جمع و کسر است. یعنی تفاضل عددی دو کلمه مقداری معنی دار است که نتیجه گیری های مختلفی میشود انجام داد.
مثلا نسبت بین ایران به تهران برابر نسبت عراق به بغداد است
یا نسبت معلم به شاگرد مثل نسبت افلاطون به ارسطوست

طبیعتا دیتابیس هایی که برای مشخص کردن این نسبت ها استفاده میشود در صورت یکه بودن قابلیت مشخص کردم رسم الخط را نیز فراهم میکند. یعنی مشخص میکند این جمله در این ادبیات چقدر قابل ارایه است. از طرفی امکان ارایه جمله یا قانون جدید در ادبیات مشخص وجود دارد. به طور مثال با خواندن فرهنگ ارسطویی میتوانید یک قانون جدید را مطرح کنید و نسبت درستی این مطلب به نسبت ادبیات زبانی را مشخص کنیم.

این روش به طور کلی از روش های مدل پنهان مارکوف است که در این حالت حلقه گرافی تاثیر مستقیمی ندارد. در این روش شما با عددی که train شده است هر گونه پردازشی میکنید. البته ترکیب این ادبیات با روش های شبکه عصبی نتیجه های جالب تری خواهد دارد که در مدل های دیگر مطرح خواهد شد

نمونه خروجی های این سیستم
رابطه کلی
پایتخت + ایران -> تهران
کشور + میهن -> ایران
پدر +‌ گوساله -> گاو

رابطه نسبتی
کرمان – رفسنجان + اردکان -> یزد
برانکو – پرسپولیس + استقلال -> منصوریان
تهران – ایران + انگلیس -> لندن
روحانی – ایران + ترکیه -> اردوغان

 

این رابطه ها قابلیت بهبود زیادی دارند و تمام بررسی ها بر پایه ویکی پوده است.

ادامه مطلب

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

منبع اصلی نوشتار زیر در این لینک قرار دارد

منبع اصلی نوشتار زیر در این لینک قرار دارد

بیست پروژه برتر پایتون در گیت‌هاب

همونطور که می‌دونید گیت‌هاب یه مخزنه از میلیون‌ها پروژه‌ی مختلف که توسط کاربران به زبان‌های برنامه‌ نویسی مختلف نوشته شدن و کاربران می‌تونن به پروژه‌ها امتیاز بدن. اگه برنامه نویس هستید یا به پایتون علاقه دارید این لیست رو حتما ببینید. حداقل خوبه که آدم اسمشون رو بدونه :)

توی این پست با بیست پروژه‌ی برتر سال گذشته که با پایتون نوشته شدن آشنا می‌شیم.

ادامه مطلب

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

منبع اصلی نوشتار زیر در این لینک قرار دارد

لذت برنامه نویسی: IPython Notebook یا Jupyter Notebook

اینم یه تجربه پراکنده دیگه! من این چند روز بخاطر یه کاری نیاز داشتم یه مساله تئوری گراف رو حل کنم. من معمولا سعی میکنم که توی کارها یه چیز جدید رو یاد بگیرم. به همین خاطر با استفاده از ipython notebook یا jupyter notebook مساله رو حل کردم. اتفاقا جادی هم یه ویدئوی آموزشی […]

نوشته لذت برنامه نویسی: IPython Notebook یا Jupyter Notebook اولین بار در تجربه های پراکنده پدیدار شد.

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

سومین کنفرانس پایتون ایران

پایتون یک زبان برنامه نویسی خوب و دوست داستنی هست که معمولا هر سال برنامه نویسان و دوست داران این زبان برنامه نویسی اقدام به برگزاری کنفرانسی با این موضوع … ادامه

مطالب مرتبط :

  1. دومین کنفرانس پایتون ایران
  2. برنامه مدیریت پکیج easy life (نصب آسان برنامه ها و کدک ها)
  3. آموزش نصب مخازن RPMFusion در فدورا ۲۳
  4. آموزش نصب نرم افزار Simple Screen Recorder
  5. نصب و پیکربندی سیستم مانیتورینگ Zabbix – بخش ۹

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

دنیای پایتون

python

اینجا قراره هر چی نکته درباره پایتون یاد میگیرم رو باهاتون به اشتراک بذارم.

سایت های آموزشی

بهترین مرجع از دید من سایت tutorialspoint است. بسیار ساده و روون کارش رو شروع کرده و برای کسایی که دوست دارن به صورت سریع فقط کلیات رو یاد بگیرن عالیه.هر چند برای درک عمیق تر فقط و فقط داکیومنت های خود سایت پایتون قابل اتکا هست.و البته تو این لینک هم میتونید مطالب خوبی یاد بگیرید.

ادامه مطلب

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

API برای سایت Subscene

سایت Subscene منبع خوب و جامعی برای دریافت زیرنویس‌ها به اکثر زبان‌هاست و اکثرا زیرنویس فیلم یا سریالی که دنبالش هستم رو توش پیدا می‌کنم. برای انجام پروژه‌ای به یک API برای دریافت زیرنویس‌ها از این سایت نیازمند شدم و بعد از کمی جستجو، به این رسیدم.

دموی خودش مشکل داخلی سرور داشت؛ از این که خود مخزن رو کلون کنم و جداگانه اجراش کنم به علت مشکلات دیگه‌ای(از جمله سیستم Google App Engine) صرف نظر شد و خودم با استفاده از کتابخونه‌ی BeautifulSoup4٬ یک API برای سایت Subscene به زبان پایتون(نسخه‌ی ۳) درست کردم.

پیوند به مخزن گیت‌هاب

پروژه‌ای که قرار بود از این API استفاده کنه رو طی چند روز آینده معرفی خواهم کرد.

لذت ببرید و البته Pull Requestهاتون رو هم فراموش نکنید :))

ادامه مطلب

منبع اصلی نوشتار زیر در این لینک قرار دارد

ویژگی‌هایی از پایتون که شما ممکن است ندانید – قسمت سوم

python

پایتون زبان بزرگ و قدرتمندیه که کار باهاش از نظر من بسیار لذت بخش و دوست داشتنیه. بسیاری از ویژگی‌های پایتون فقط توی این زبان دیده می‌شه و توی هیچ زبانی مشابهشون پیدا نمیشه. در این سری پست‌ها این ویژگی‌ها رو معرفی می‌کنم.

ادامه مطلب ادامه مطلب

به سیاره لینوکس امتیاز دهید

به اين صفحه امتياز دهيد