پایتون به همراه زبان R، یکی از مهم ترین ابزارهایی هستند که به درد دیتاساینس کار ها می خورند. این زبان برنامه نویسی همچنین یکی از ساده ترین و بهترین زبان های نزدیک به زبان انسان می باشد که میتوانید برای اهداف ذکر شده ان را در چند روز فرا بگیرید.
به خاطر اهمیت بالای این زبان و کارایی ان برآن شدیم تا کمی شما را با کتابخانه های کارامد آن آشنا کنیم. این زبان برنامه نویسی دارای کتابخانه های خاصی می باشد که بسیار برای دیتاساینس کارهای جهانی محبوب هستند. در زیر برخی از ان ها را که بیشتر مورد استفاده قرار می گیرند معرفی کرده ایم:
NumPy
NumPy یک ماژول توسعه یافته و متن باز می باشد که برای پایتون موجود است. این ماژول به شما عملکرد های از پیش تعیین شده ای از روال ها و روتین های عددی ارائه می کند. کار کردن با آن بسیار ساده است و میتواند به خوبی از پس ارایه های چند بعدی بسیار بزرگ و ماتریکس ها بر بیاید. یکی دیگر از مزیت های نامپی این است که شما میتوانید عملیات های ریاضی استاندارد مورد نظر خودتان را بر روی همه داده هایتان بدون نیاز به ایجاد حلفه اعمال کنید. با این ماژول همچنین می توانید از اطلاعاتتان برای استفاده در کتابخانه های سطح پایین تری مثل (کتابخانه هایی که به زبان سی یا سی پلاس پلاس نوشته شده اند ) خروجی بگیرید.
نامپی به شما کمک می کند که به خوبی با محاسبات ارایه گرا و مفهوم ارائه ها اشنا شده و با آن ها کار کنید.
.
Scipy
SciPy یک ماژول پایتون می باشد که امکان دستکاری در ارایه های n بعدی را به آسانی و با سرعت فراهم می سازد. همچنین روتین ها و روال های عددی نیز همچون روتین هایی برای انتگرال گیری عددی و بهینه سازی در این ماژول بصورت یک امکان موثر و بسیار کاربرپسند اضافه شده اند
. SciPy ماژول هایی برای بهینه سازی، جبر خطی، ادغام و دیگر وظایف مشترک در علم داده ها را به عهده دارد.
Matplotlib
Matplotlib ماژولی برای تصویر سازی و ویژوالیزیشن می باشد. Matplotlib این امکان را به شما می دهد که به سرعت یافته های خود را به صورت گراف و نمودار در آورده و فیگورهای حرفه ای بسازید. با استفاده از این ماژول می توانید از هر جنبه ای که بخواهید اشکال خود را بسازید و سفارشی سازی کنید.
.
Scikit-Learn
Scikit-Learn یک ماژول پایتون برای یادگیری ماشینی می باشد که بر روی SciPy سوار می شود. این ماژول مجموعه ای از الگوریتم های معروف یادگیری ماشینی می باشد که که از طریق یک رابط کاربری سازگار به کاربران ارائه شده است. در اینجا میتوانید نیم نگاهی به سری الگوریتم های موجود در این ماژول بپردازید.
.
Pandas
Pandas ماژولی برای پایتون می باشد که دارای ساختارهای اطلاعاتی سطح بالا و ابزارهای
طراحی برای عملیات های ساده و سریع انالیزی می باشد. این ماژول بر روی NumPy سوار می بشود و استفاده از NumPy را آسان تر می سازد.
.
Theano
Theano این کتابخانه، همچون Numpy بسیار برای محاسبات عددی مناسب می باشد.
بعضی کتابخانه ها همچون کتابخانه Pylearn2 از Theano به عنوان کامپوننت مرکزی
برای عملیات های محاسباتی استفاده می کنند. Theano به شما اجازه می دهد تا عبارات
ریاضی را ارزیابی، بهینه سازی و تعریف کنید تا بتوانید بر روی ارایه های چند بعدی آنها را اعمال کنید.
.
NLTK
NLTK پلتفورمی پیشرو در زمینه ساخت برنامه های پایتون برای کار با داده های به زبان انسان می باشد.
این کتابخانه رابطی با استفاده آسان از بیش از ۵۰ پیکره و منابع واژگانی همچون WordNet، به همراه
مجموعه ای از کتابخانه های پردازش متن برای طبقه بندی، توکنیزیشن، ریشه یابی، برچسب زدن، تجزیه
کردن و استدلال معنایی و wrappers برای کتابخانه های NLP صنعتی ارائه می کند. NLTK به عنوان
موفق ترین پلت فورم پروتوتایپ سازی و ساخت سیستم های تحقیقاتی شناخته می شود.
.
Statsmodels
Statsmodels ماژول و مدلی برای پایتون می باشد که به کاربران خود اجازه میدهد در اطلاعات
خود به اکتشاف بپردازند، مدل های آماری را ارزیابی کنند و تست های آماری بگیرند.
.
PyBrain
PyBrain مخفف یادگیری تقویتی، هوش مصنوعی و شبکه عصبی مبتنی بر پایتون می باشد
(Python-Based Reinforcement Learning, Artificial Intelligence, and Neural Network).
این کتابخانه، کتابخانه ای متن باز می باشد که مخصوصا برای شبکه های عصبی
و آموزش بدون نظارت مورد استفاده قرار می گیرد.
.
Gensim
Gensim یک کتابخانه برای مدل سازی موضوعی می باشد و بر روی Numpy و Scipy سوار می شود.
منبع : مفتا