Machine Learning

من یک مهندس فناوری اطلاعات هستم که علاقه زیادی به دنیای فناوری اطلاعات، برنامه نویسی، امنیت و شبکه دارم.

یادگیری ماشین لرنیتنگ یا یادگیری ماشینی را از کجا شروع کنیم؟

۵۰۸ بازديد
اگر واقعا می خواهید قابلیت ها و محدودیت های یادگیری ماشین را درک کنید، باید دستیار خود باشید. در اینجا یک لیست کوتاه از گزینه های برای مبتدیان است.
هر کس باید یک درک مفهومی از یادگیری ماشین داشته باشد تا بتوانند با تمرینکنندگان به طور موثرتر ارتباط برقرار کنند. برای اینکه واقعا بدانید که یادگیری ماشین چه چیزی می تواند و نمی تواند انجام دهد، شما باید با آن دست و پنجه نرم کنید، این همان چیزی است که کنجکاو، سازندگان حرفه ای و حل کننده های DIY انجام می دهند.


نقطه شروع برای افراد بر اساس آموزش و تجربه آنها متفاوت است. با این حال، عناوین منابع ممکن است لزوما این واقعیت را منعکس نکنند. در زیر یک لیست کوتاه از منابع با کمی درک به نیاز و ارزش خود را است. یادگیری عمیق، یک زیر شاخه یادگیری ماشین، عمدا حذف شده است تا تمرکز این مقاله را به یادگیری ماشین به طور کلی حفظ کنید.

مسابقات

مسابقات فرصتی را برای هر کسی فراهم می کند تا با یادگیری ماشین دست به کار شود. اجازه ندهید که کلمه "رقابت" شما را بترساند، زیرا شما منابع زیادی در این سایت ها برای هر کسی به صورت رایگان در اختیار دارید. بعدها، اگر تصمیم به رقابت دارید، و اگر موقعیتی برجسته ای در هیئت مدیره رهبر کسب کنید، شما باید چیزی بیشتر به رزومه خود اضافه کنید.

Kaggle یک پلتفرم علمی داده است که کسب و کارها برای حل مشکل به مشکل برخورد می کنند. کاربران می توانند به مجموعه داده ها، هسته، دوره های مینی رایگان، انجمن، وبلاگ ها، پست های شغلی، مستندات و موارد دیگر دسترسی داشته باشند.

Open ML (بتا 2) خود را "جنبش فراگیر برای ساختن اکوسیستم باز، سازمان یافته و آنلاین برای یادگیری ماشین" توصیف میکند. این ابزارهای منبع باز را برای کشف و به اشتراک گذاری داده ها ایجاد می کند. شرکت کنندگان می توانند داده های باز را به محیط یادگیری ماشین های مورد علاقه خود بکشند و خود را با مدل های خود یا با کمک دانشمندان داده های اجتماعی بسازند.

AnalyticsVidhya خود را به عنوان "اکوسیستم علم اطلاعات نسل بعدی" قرار می دهد. وب سایت آن دسترسی به مسابقات، جامعه، آموزش، وبلاگ ها، گواهینامه ها و لیست های کاری را فراهم می کند.

دوره های آنلاین، bootcamps و برنامه های گواهینامه

توجه داشته باشید که بسیاری از دوره های مقدماتی، سطح پایه ای دانش را در اختیار همه قرار می دهند، بنابراین عناوین منابع می توانند گمراه کننده باشند. به عنوان مثال، دوره های مقدماتی و پیشرفته "Introduction to Machine Learning"، مهارت های برنامه نویسی R یا آموزش زبان Python و سطح دانش در کالج، جبر خطی و آمار را در نظر می گیرند. همچنین دوره هایی برای رهبران کسب و کار و دیگران که نیاز به مهارت های برنامه نویسی اساسی (نه لزوما در R یا Python) و مهارت های ریاضی پایه وجود دارد.

واژه های مشاوره از متخصصان

اگر میخواهید با یادگیری ماشین موفق شوید، جاش فلیچر، یک مهندس مکانیک در AI و مشاوره یادگیری ماشین Atrium، سه توصیه ارائه میدهد:

یاد بگیرید چگونه داده ها را بکشید و دستکاری کنید
داده های حقیقی هرگز به اندازه کافی در کتاب های درسی نیست
برای استفاده از مدل هایی که می سازید، باید بدانید که اطلاعات چه معنایی دارد. شما نمی توانید این را بدون درک عملیات تجاری بدانید
دانش آموخته سرباز آمین کاظروونی، زاپوپس توصیه می کند با مشکالت کسب و کار شروع به جای یادگیری دستگاه کند.

کازروونی گفت: "ایجاد مشکلات برای راه حل های سرد، به ندرت یک سرمایه گذاری صحیح است." "در عوض، به بزرگترین مشکلات و داده های شما نگاه کنید و سپس آن مشکلات را با داده های خود مطابقت دهید. این به شما اجازه می دهد تا راهکارهای یادگیری ماشین را برای مسائل اصلی کسب و کار آماده کنید [و] شما را برای احتمال بسیار بیشتر برای موفقیت در فضا آماده می کند. "

Konrad Pabianczyk، تیم مدیریت کسب و کار AI در Netguru طرفداران Scikit-Learn برای Python و Tensorflow است.

"Pabianczyk گفت:" Scitkit یادگیری دارای مدارک خوب هدفمند درک روش های مختلف است. " "این می تواند شروع خوبی برای یادگیری، به عنوان مثال .. که در آن الگوریتم های متعدد برای درک بهتر بهبود یافته مقایسه شده است. برای پیدا کردن چارچوب های یادگیری ماشین خاص، شروع به شروع با Tensorflow".

زبان برنامه نویسی پایتون ابزاری برای یادگیری ماشین و هوش مصنوعی

۵۱۲ بازديد
توسعه دهندگان واقعا از زبان برنامه نویسی Python استفاده می کنند؟

با توجه به نظرسنجی توسعه دهندگان توسط JetBrains (که همچنین Kotlin را معرفی کرد، زبان پیشرفته برای توسعه اندروید)، 49 درصد از آنها می گویند از تحلیل Python برای تحلیل داده ها استفاده می کنند، پیش از توسعه وب (46 درصد)، یادگیری ماشین (42 درصد ) و مدیریت سیستم (37 درصد).

تعداد قابل توجهی از توسعه دهندگان نیز از زبان برای تست نرم افزار (25 درصد)، نمونه اولیه نرم افزار (22 درصد) و "اهداف آموزشی" (20 درصد) استفاده می کنند. هرچند کمتر آن را برای گرافیک، توسعه جاسازی شده یا بازی / توسعه تلفن همراه انتخاب کردیم.


این داده ها فقط ایده کلی را تقویت می کند که پایتون بلای فضای تجزیه و تحلیل داده ها است. اگرچه زبانهای بسیار تخصصی مانند R جایگاه خود را در میان دانشگاهیان و تحلیلگران محققان بیشتر محسوب می شوند، اما واضح است که سهولت استفاده نسبی پایتون (به جز در همه جا آن)، آن را در بین کسانی که نیاز به اطلاعات را برای برخی از جنبه ها دارند، بسیار دوست دارند از مشاغل آنها.

این روند نیز برای مدت زمان زیادی ادامه دارد: در فوریه 2018، نظرسنجی KDnuggets نشان داد که کاهش مصرف R به نفع Python در بین جوانانی که از هر دو زبان استفاده می کنند، کاهش می یابد. در طول همان دوره، یک نظرسنجی جداگانه از Burtch Works نشان داد که استفاده از زبان در میان متخصصان تجزیه و تحلیل، از 53 درصد به 69 درصد در طی مدت مشابه دو سال افزایش یافته است، در حالی که پایگاه کاربری R تقریبا یک سوم کاهش یافته است.

اما شما همچنین نمی توانید از استفاده پایتون در یادگیری ماشین نادیده بگیرید، که به طور گسترده ای به عنوان بخش مهمی از تقریبا هر استراتژی فناوری آینده هر شرکتی مورد توجه است. اگر توسعه دهندگان از پایتون برای ساخت ابزار یادگیری ماشین استفاده می کنند، به این معنی است که زبان یک قفل بزرگ در ML / A.I دارد. اکوسیستم به نظر می رسد که چگونه نرم افزار آینده توسعه می یابد.


اگر پایتون را نمی دانید، این یک زبان حیاتی برای یادگیری است. خوشبختانه انواع وب سایت ها، کتاب ها و سایر منابع وجود دارد که می تواند شما را سریع کند.

کدام نسخه از پایتون را استفاده می کنید؟
داده های JetBrains نشان می دهد که اکثریت قابل توجه توسعه دهندگان (87 درصد) در پایتون 3 هستند، در حالی که 13 درصد هنوز در پایتون 2 هستند. این رشد بسیار سریع برای پایتون 3 است که سه چهارم بازار در سال گذشته داشت.

زبان به نسخه 3.7.3 است و تکرارهای جدید ویژگی های مفیدی را برای توسعه دهندگان اضافه می کند. به عنوان مثال، 3.7.0 شامل توابع زمان جدید، حالت UTF-8 مجازی، نقطه بوق ساخته شده، کلاس داده ها و حالت زمان اجرا است. به عبارت دیگر، توسعه دهندگان برای ادامه کار با نسخه قدیمی تر سخت است که در نسخه های بعدی به کار خود ادامه دهد تا زندگی آنها را ساده تر کند، مگر اینکه کار آنها مستلزم مبارزه با کد های میراثی باشند که قابل ارتقا نیست.

بسته به آنچه میخواهید انجام دهید، ممکن است بخواهید از پایتون 2 استفاده کنید. از این صفحه برای مقایسه 2.x و 3.x استفاده کنید، که شاید فرآیند تصمیمگیری شما را سادهتر کند.

یادگیری ماشینی بازی تاج و تخت را پیش بینی می کند

۴۸۳ بازديد
هیچ کس نمی خواهد سریال محبوب به پایان برسد. بعضی ها، مانند جی پی اس در Pachyderm، طول عمر طولانی خود را برای گسترش عمر خود، به نقطه استخدام ML برای خدمت به تخت آهن است.


این یک نمونه جدید از انتقال سبک است که ML ویژگی های اصلی ژانر را به منظور ایجاد نمونه های خود، مانند ما قبلا با هنر و حتی با پخت و پز آشنا کرده ایم.

اما اول از همه، چه Pachyderm و چه کجا این کلمه آمده است؟

Pachy-Derm یک ترجمه مستقیم از کلمه یونانی "παχύ-δερμο" است که به معنی "پوست چرب" است که به الف در فیلمی اشاره دارد. فیل خود را برای نشان دادن رابطه Pachyderm با Hadoop، یکی دیگر از آرم فیل، اما نشان می دهد به عنوان همپوش جدید و بهتر خود استفاده می شود.

Pachyderm، مانند Hadoop، یک موتور تحلیلگر است، به دنبال همان فلسفه است اما ساخته شده برای رفتن به جایی که Hadoop کوتاه می افتد. بنابراین در جای جای نوشتن مشاغل در جاوا و اجرای آنها در JVM، از ظروف Docker مستقر در Kubernetes استفاده می شود که می تواند شامل شغل های نوشته شده در هر زبان باشد. در عوض HDFS، از فایل سیستم Pachyderm استفاده می کند و در عوض MapReduce، از Pipetines Pachyderm برای بسته بندی لوله ها با هم استفاده می کند، همانطور که در مثال مثال GoT ML نشان داده شده است. برای اطلاعات بیشتر در مورد آخرین نسخه، از Pachyderm دیدن سریع تر و به دست آوردن بودجه.

هدف Pachyderm این است که برنامه نویسان را که با MapReduce یا برنامه نویسی Java آشنا نیستند را برای نوشتن برنامه های تجزیه و تحلیل خود با هر وسیله ای که مناسب می بینند را قادر می سازد؛ به عنوان مثال، توسعه دهندگان می توانند پردازش داده های خود را بدون نیاز به دانش فنی تخصصی انجام دهند، از این رو Pachyderm به عنوان بسیار قابل دسترس گزینه از Hadoop.

مثال GoT شامل قرار دادن Pachyderm به عنوان یک ظرف در Kubernetes در AWS S3 سطل و مخزن نگه داشتن داده های ورودی / خروجی مورد استفاده است.

داده های ورودی اسکریپت های پیش پردازش شده فصل 1 قسمت 1 هستند. آنها برای کمک به شبکه عصبی مکرر مورد استفاده قرار گرفته اند که بین محاوره ها و سایر عناصر اسکریپت به عنوان "نمایش"، به طور عمده جهت صحنه و تنظیمات زمینه، تشخیص داده می شود:

Pachyderm این داده ها ذخیره شده محلی را می گیرد و اولین خط لوله را شروع می کند و داده ها را به ظرفی که TensorFlow را اجرا می کنند را برای آموزش مدل می گیرد. پس از پردازش، TF خروجی مدل و همچنین فایل های خاص TF را به عقب بازگرداند.

سپس خط دوم شروع می شود که به عنوان ورودی آن فایل های خروجی در مرحله قبل را می گیرد و با آن یک مثال دیگر TF برای تولید اسکریپت ها فراهم می کند. همانطور که ساده است، بدون پیچیدگی MapReduce.



اولین اسکریپتهای ساخته شده حساسیت زیادی نداشتند، اما با افزایش سطح دقت TensorFlow و همچنین تغذیه اسکریپتهای NN، کیفیت نیز میتواند بسیار بهبود یابد. با این حال، توجه داشته باشید که افزایش دقت نیز زمان پردازش را از ساعت ها تا حتی روزها بسته به زیرساخت های زیرزمینی افزایش می دهد.

پروژه Github repo حاوی اسکریپت هایی است که با دقت مدل کم تولید شده اند، بد نیست بدانید که کل فرآیند یک ساعت طول می کشد و در حالی که برنده Emmys نمی شود، آنها به عنوان یک شاهکار قابل توجهی از انتقال سبک به حساب می آیند تا اینکه "بسیار ماهیت" بدست آورد.

این شبکه عصبی زبان انگلیسی را نمی دانست، خیلی کمتر دستور زبان، اما برخی از قطعات ساختار را برداشت:

آن آموخته است که هر خط یا یک خط سخن گفته است، یا یک خط نمایشگاه

آن را یاد گرفت که خطوط گفتاری با یک نام شروع می شود

آن را یاد گرفتم که کلمات نام ها بودند
    آن را آموخت که چگونه براکت ها را در اطراف یک نام باز / بسته کن
    این نوع کلمات را آموخت (افعال کنونی فعلی، من / شما
     اسم ها) استفاده می شود در خطوط گفتاری

آن را یاد گرفت چگونه برای باز کردن / بستن براکت برای خطوط نمایشگاه
    آن را یاد گرفت چه نوع از کلمات (شخص 3) استفاده می شود
قرار دادن اسکریپت های دیگر به طور خودکار دوباره خط لوله را برای بازآموزی مدل و تولید اسکریپت های جدید به طور خودکار شروع می کند. بازپرداخت پروژه همچنین شامل دستورالعمل هایی در مورد چگونگی تکرار آزمایش خود می شود، بنابراین اگر کیفیت خروجی درست باشد، برای خودتان قضاوت کنید طرح سری.

بگو، چرا شبکه اجازه ندهید فصل 9 را تنظیم کند و همه را خوشحال کند؟