یادگیری ماشینی

من یک مهندس فناوری اطلاعات هستم که علاقه زیادی به دنیای فناوری اطلاعات، برنامه نویسی، امنیت و شبکه دارم.

یادگیری ماشین لرنیتنگ یا یادگیری ماشینی را از کجا شروع کنیم؟

۵۰۸ بازديد
اگر واقعا می خواهید قابلیت ها و محدودیت های یادگیری ماشین را درک کنید، باید دستیار خود باشید. در اینجا یک لیست کوتاه از گزینه های برای مبتدیان است.
هر کس باید یک درک مفهومی از یادگیری ماشین داشته باشد تا بتوانند با تمرینکنندگان به طور موثرتر ارتباط برقرار کنند. برای اینکه واقعا بدانید که یادگیری ماشین چه چیزی می تواند و نمی تواند انجام دهد، شما باید با آن دست و پنجه نرم کنید، این همان چیزی است که کنجکاو، سازندگان حرفه ای و حل کننده های DIY انجام می دهند.


نقطه شروع برای افراد بر اساس آموزش و تجربه آنها متفاوت است. با این حال، عناوین منابع ممکن است لزوما این واقعیت را منعکس نکنند. در زیر یک لیست کوتاه از منابع با کمی درک به نیاز و ارزش خود را است. یادگیری عمیق، یک زیر شاخه یادگیری ماشین، عمدا حذف شده است تا تمرکز این مقاله را به یادگیری ماشین به طور کلی حفظ کنید.

مسابقات

مسابقات فرصتی را برای هر کسی فراهم می کند تا با یادگیری ماشین دست به کار شود. اجازه ندهید که کلمه "رقابت" شما را بترساند، زیرا شما منابع زیادی در این سایت ها برای هر کسی به صورت رایگان در اختیار دارید. بعدها، اگر تصمیم به رقابت دارید، و اگر موقعیتی برجسته ای در هیئت مدیره رهبر کسب کنید، شما باید چیزی بیشتر به رزومه خود اضافه کنید.

Kaggle یک پلتفرم علمی داده است که کسب و کارها برای حل مشکل به مشکل برخورد می کنند. کاربران می توانند به مجموعه داده ها، هسته، دوره های مینی رایگان، انجمن، وبلاگ ها، پست های شغلی، مستندات و موارد دیگر دسترسی داشته باشند.

Open ML (بتا 2) خود را "جنبش فراگیر برای ساختن اکوسیستم باز، سازمان یافته و آنلاین برای یادگیری ماشین" توصیف میکند. این ابزارهای منبع باز را برای کشف و به اشتراک گذاری داده ها ایجاد می کند. شرکت کنندگان می توانند داده های باز را به محیط یادگیری ماشین های مورد علاقه خود بکشند و خود را با مدل های خود یا با کمک دانشمندان داده های اجتماعی بسازند.

AnalyticsVidhya خود را به عنوان "اکوسیستم علم اطلاعات نسل بعدی" قرار می دهد. وب سایت آن دسترسی به مسابقات، جامعه، آموزش، وبلاگ ها، گواهینامه ها و لیست های کاری را فراهم می کند.

دوره های آنلاین، bootcamps و برنامه های گواهینامه

توجه داشته باشید که بسیاری از دوره های مقدماتی، سطح پایه ای دانش را در اختیار همه قرار می دهند، بنابراین عناوین منابع می توانند گمراه کننده باشند. به عنوان مثال، دوره های مقدماتی و پیشرفته "Introduction to Machine Learning"، مهارت های برنامه نویسی R یا آموزش زبان Python و سطح دانش در کالج، جبر خطی و آمار را در نظر می گیرند. همچنین دوره هایی برای رهبران کسب و کار و دیگران که نیاز به مهارت های برنامه نویسی اساسی (نه لزوما در R یا Python) و مهارت های ریاضی پایه وجود دارد.

واژه های مشاوره از متخصصان

اگر میخواهید با یادگیری ماشین موفق شوید، جاش فلیچر، یک مهندس مکانیک در AI و مشاوره یادگیری ماشین Atrium، سه توصیه ارائه میدهد:

یاد بگیرید چگونه داده ها را بکشید و دستکاری کنید
داده های حقیقی هرگز به اندازه کافی در کتاب های درسی نیست
برای استفاده از مدل هایی که می سازید، باید بدانید که اطلاعات چه معنایی دارد. شما نمی توانید این را بدون درک عملیات تجاری بدانید
دانش آموخته سرباز آمین کاظروونی، زاپوپس توصیه می کند با مشکالت کسب و کار شروع به جای یادگیری دستگاه کند.

کازروونی گفت: "ایجاد مشکلات برای راه حل های سرد، به ندرت یک سرمایه گذاری صحیح است." "در عوض، به بزرگترین مشکلات و داده های شما نگاه کنید و سپس آن مشکلات را با داده های خود مطابقت دهید. این به شما اجازه می دهد تا راهکارهای یادگیری ماشین را برای مسائل اصلی کسب و کار آماده کنید [و] شما را برای احتمال بسیار بیشتر برای موفقیت در فضا آماده می کند. "

Konrad Pabianczyk، تیم مدیریت کسب و کار AI در Netguru طرفداران Scikit-Learn برای Python و Tensorflow است.

"Pabianczyk گفت:" Scitkit یادگیری دارای مدارک خوب هدفمند درک روش های مختلف است. " "این می تواند شروع خوبی برای یادگیری، به عنوان مثال .. که در آن الگوریتم های متعدد برای درک بهتر بهبود یافته مقایسه شده است. برای پیدا کردن چارچوب های یادگیری ماشین خاص، شروع به شروع با Tensorflow".

یادگیری ماشینی بازی تاج و تخت را پیش بینی می کند

۴۸۳ بازديد
هیچ کس نمی خواهد سریال محبوب به پایان برسد. بعضی ها، مانند جی پی اس در Pachyderm، طول عمر طولانی خود را برای گسترش عمر خود، به نقطه استخدام ML برای خدمت به تخت آهن است.


این یک نمونه جدید از انتقال سبک است که ML ویژگی های اصلی ژانر را به منظور ایجاد نمونه های خود، مانند ما قبلا با هنر و حتی با پخت و پز آشنا کرده ایم.

اما اول از همه، چه Pachyderm و چه کجا این کلمه آمده است؟

Pachy-Derm یک ترجمه مستقیم از کلمه یونانی "παχύ-δερμο" است که به معنی "پوست چرب" است که به الف در فیلمی اشاره دارد. فیل خود را برای نشان دادن رابطه Pachyderm با Hadoop، یکی دیگر از آرم فیل، اما نشان می دهد به عنوان همپوش جدید و بهتر خود استفاده می شود.

Pachyderm، مانند Hadoop، یک موتور تحلیلگر است، به دنبال همان فلسفه است اما ساخته شده برای رفتن به جایی که Hadoop کوتاه می افتد. بنابراین در جای جای نوشتن مشاغل در جاوا و اجرای آنها در JVM، از ظروف Docker مستقر در Kubernetes استفاده می شود که می تواند شامل شغل های نوشته شده در هر زبان باشد. در عوض HDFS، از فایل سیستم Pachyderm استفاده می کند و در عوض MapReduce، از Pipetines Pachyderm برای بسته بندی لوله ها با هم استفاده می کند، همانطور که در مثال مثال GoT ML نشان داده شده است. برای اطلاعات بیشتر در مورد آخرین نسخه، از Pachyderm دیدن سریع تر و به دست آوردن بودجه.

هدف Pachyderm این است که برنامه نویسان را که با MapReduce یا برنامه نویسی Java آشنا نیستند را برای نوشتن برنامه های تجزیه و تحلیل خود با هر وسیله ای که مناسب می بینند را قادر می سازد؛ به عنوان مثال، توسعه دهندگان می توانند پردازش داده های خود را بدون نیاز به دانش فنی تخصصی انجام دهند، از این رو Pachyderm به عنوان بسیار قابل دسترس گزینه از Hadoop.

مثال GoT شامل قرار دادن Pachyderm به عنوان یک ظرف در Kubernetes در AWS S3 سطل و مخزن نگه داشتن داده های ورودی / خروجی مورد استفاده است.

داده های ورودی اسکریپت های پیش پردازش شده فصل 1 قسمت 1 هستند. آنها برای کمک به شبکه عصبی مکرر مورد استفاده قرار گرفته اند که بین محاوره ها و سایر عناصر اسکریپت به عنوان "نمایش"، به طور عمده جهت صحنه و تنظیمات زمینه، تشخیص داده می شود:

Pachyderm این داده ها ذخیره شده محلی را می گیرد و اولین خط لوله را شروع می کند و داده ها را به ظرفی که TensorFlow را اجرا می کنند را برای آموزش مدل می گیرد. پس از پردازش، TF خروجی مدل و همچنین فایل های خاص TF را به عقب بازگرداند.

سپس خط دوم شروع می شود که به عنوان ورودی آن فایل های خروجی در مرحله قبل را می گیرد و با آن یک مثال دیگر TF برای تولید اسکریپت ها فراهم می کند. همانطور که ساده است، بدون پیچیدگی MapReduce.



اولین اسکریپتهای ساخته شده حساسیت زیادی نداشتند، اما با افزایش سطح دقت TensorFlow و همچنین تغذیه اسکریپتهای NN، کیفیت نیز میتواند بسیار بهبود یابد. با این حال، توجه داشته باشید که افزایش دقت نیز زمان پردازش را از ساعت ها تا حتی روزها بسته به زیرساخت های زیرزمینی افزایش می دهد.

پروژه Github repo حاوی اسکریپت هایی است که با دقت مدل کم تولید شده اند، بد نیست بدانید که کل فرآیند یک ساعت طول می کشد و در حالی که برنده Emmys نمی شود، آنها به عنوان یک شاهکار قابل توجهی از انتقال سبک به حساب می آیند تا اینکه "بسیار ماهیت" بدست آورد.

این شبکه عصبی زبان انگلیسی را نمی دانست، خیلی کمتر دستور زبان، اما برخی از قطعات ساختار را برداشت:

آن آموخته است که هر خط یا یک خط سخن گفته است، یا یک خط نمایشگاه

آن را یاد گرفت که خطوط گفتاری با یک نام شروع می شود

آن را یاد گرفتم که کلمات نام ها بودند
    آن را آموخت که چگونه براکت ها را در اطراف یک نام باز / بسته کن
    این نوع کلمات را آموخت (افعال کنونی فعلی، من / شما
     اسم ها) استفاده می شود در خطوط گفتاری

آن را یاد گرفت چگونه برای باز کردن / بستن براکت برای خطوط نمایشگاه
    آن را یاد گرفت چه نوع از کلمات (شخص 3) استفاده می شود
قرار دادن اسکریپت های دیگر به طور خودکار دوباره خط لوله را برای بازآموزی مدل و تولید اسکریپت های جدید به طور خودکار شروع می کند. بازپرداخت پروژه همچنین شامل دستورالعمل هایی در مورد چگونگی تکرار آزمایش خود می شود، بنابراین اگر کیفیت خروجی درست باشد، برای خودتان قضاوت کنید طرح سری.

بگو، چرا شبکه اجازه ندهید فصل 9 را تنظیم کند و همه را خوشحال کند؟