داده کاوی و تصویر سازی با استفاده از قدرت پایتون
توییتر یکی از بهترین منابع موجود برای داده کاوی و داده کاوان می باشد. داده کاوان میتوانند با استفاده از دانش خود و ابزارهایی مانند tweepy که از پایتون قدرت گرفته است به جمع آوری توییت های موجود در توییتر حول محور کلید واژه ها و منابعی که مورد نظرشان میباشد بپردازند. سپس به خوشه بندی و دسته کردن این اطلاعات پرداخته تا دانش درون آنها را استخراج کند. در نهایت نیز می بایست با استفاده از ابزارهای تصویر سازی مانند گفی یا networkx 2 به تصویر سازی و مصور سازی آنها بپردازند. در این جا ما نمونه ای از مراحل انجام گرفته از توضیحاتی که در بالا ذکر کرده ایم را به شما نشان داده ایم. موضوع داده کاوی این تصویر ها مربوط به یک نگاه اجمالی داشته باشیم به ۱۰ تا از تأثیرگذارترین اشخاص و صفحات با موضوع علم داده بر روی توییتر می باشد . در نمودار های میله ای، محور x مروبط به تعداد تاپیک های موجود و محور y مربوط به فراوانی کلمات موجود در این تاییک ها می باشد. همچنین اندازه این دایره ها مربوط به فراوانی کلمات با توجه به موضوع مورد نظرشان می باشد.