چرا ‘داده’ و ‘A.I.’ همیشه با هم برو
چرا ‘داده’ و ‘A.I.’ همیشه با هم برو
دادهها و A.I. A.I. و داده.
تقریباً همیشه این دو اصطلاح را در یک نفس می شنوید. چرا اینطور است؟
اگر بنیانگذار در تلاش برای درک بیشتر در مورد این موضوعات است، خواه این موضوع برای بهبود گردش کار یا محصولات شما باشد یا برخی از جنبه های شما عملیات، در اینجا مقدمه صاحب کسب و کار در مورد اینکه مردم وقتی اصرار دارند که این دو را با هم بگویند، چه منظوری دارند.
A.I. برای انجام هر کاری به داده نیاز دارد.
در هسته خود، A.I. الگوریتمی است که در زبان انگلیسی ساده فرآیندی است که ورودی ها را می گیرد و خروجی ها را تولید می کند. بسیار شبیه به ماشین شما، که فقط یک تکه فلز است که در گاراژ نشسته تا زمانی که سوخت لازم برای حرکت آن باشد، یک الگوریتم به تنهایی بدون دادهای برای پردازش نمیتواند هیچ چیز مفیدی ایجاد کند. در واقع، اصلاً نمی تواند چیزی بسازد.
این بدان معناست که اگر می خواهید شرکت شما از A.I. استفاده کنید، اولین کار جمع آوری داده های شما و رو فرم. به گفته فونگ نگوین، بنیانگذار شرکت مشاوره علم داده Partners in Company، این می تواند یک مانع واقعی باشد. او میگوید: «از مشتریهایی که با آنها کار کردهایم و با آنها صحبت کردهایم، موانعی که برای دادهمحور بودن بیشتر وجود دارد، معمولاً اصول اولیه داشتن دادههای تمیز و ثابت و متمرکز و ایمن بودن آنها است.
معمولاً به این معنی است که دادههای خود را از صفحات گسترده خارج کنید یا دادههای خود را از چندین پلتفرم با هم جمع کنید – مانند یک پلت فرم مدیریت ارتباط با مشتری (CRM) و یک پلت فرم بازاریابی — به یک مخزن متمرکز، جایی که داده ها می توانند شروع به ترکیب و مقایسه برای تجزیه و تحلیل کنند. به طور معمول، پس از آن هنوز باید به روشهای مختلف تمیز و عادی شود تا از سازگاری و شکل مناسب آن مطمئن شود قبل از اینکه تیمهای داده بتوانند نتیجهگیری درستی داشته باشند و سپس بر روی دادهها با A.I بسازند.
چه چیزی بیشتر، بیشتر A.I. برای تولید نتایج قابل اعتماد به مقادیر زیادی داده نیاز دارد، به همان دلیلی که برای قضاوت معقول به نمونه بزرگی از هر چیزی نیاز دارید. همه ما با نظرسنجیهای سیاسی آشنا هستیم، جایی که متخصصان معمولاً با نمونهگیری از حدود ۳۰۰ نفر، بیش از ۹۵ درصد دقت را در مورد نحوه برنامهریزی جمعیت بزرگتر برای رای دادن در یک انتخابات ادعا میکنند.
این برای انتخاب ساده بین دو گزینه است. اگر میخواهید پیشبینیهای پیچیدهتری ایجاد کنید، مانند تمایز بین انواع رفتار مشتری در دادههای بازاریابی خود، میخواهید با هزاران نمونه شروع کنید. اغلب اوقات، شما از مقدار بسیار بیشتری استفاده می کنید تا به نتایج خود اعتماد کنید.
چه مقدار داده است. آیا ما در مورد صحبت می کنیم؟ یک تجزیه و تحلیل آماری مناسب میتواند عدد دقیقی را برای آنچه میخواهید انجام دهید به شما ارائه دهد، اما به عنوان یک قاعده کلی، صدها هزار ردیف معمولاً برای تجزیه و تحلیلهای مبتنی بر یادگیری ماشینی در پایینترین حد قرار دارند. شانتل پری، دانشمند داده کهنه کار در شرکت های بزرگ و نویسنده کتاب Data Newbie to Guru، می گوید: “من عادت ندارم با چیزی کمتر از یک میلیون ردیف کار کنم.”
و برای چیزی مانند تجزیه و تحلیل بازاریابی، که در آن تمایلات مشتری که شما سعی در درک آن دارید می تواند از روز به روز و ماه متفاوت باشد. در ماه، شما همچنین می خواهید به اندازه کافی داده ها را در یک دوره طولانی جمع آوری کنید تا پیش بینی های مفیدی داشته باشید: پری می گوید: “شما می خواهید حداقل شش ماه در تجارت باشید و حداقل شش ماه داده های مشتریان خود را جمع آوری کنید.”
بنابراین اکنون متوجه شدید که چرا A.I. به داده نیاز دارد این وابستگی نیز جهت دیگری را طی می کند. حقیقت این است که شما نمی توانید یکی را بدون دیگری داشته باشید.
داده های زیادی از A.I خارج می شود.
همانطور که A.I. الگوریتم ها به داده ها به عنوان ورودی نیاز دارند، خروجی آنها اغلب شکلی از داده است.
بیایید فرض کنیم داده های بازاریابی شما به گونه ای خرد می شود که متوجه می شوید هشت دسته عمده مشتری دارید. . همچنین ممکن است متوجه شوید که دستههای مختلف مشتریان باید انواع مختلفی از طرحها یا تبلیغات را دریافت کنند. این خروجیها دادههایی هستند که میتوانید به الگوریتم دیگری وارد کنید، الگوریتمی که در آن میتوانید از آن برچسبگذاری برای پیشبینی اینکه یک مشتری آینده متعلق به کدام دسته است استفاده کنید و سپس یک فرآیند خودکار داشته باشید که به آنها پیشنهادها یا تبلیغاتی را که پیشبینی میشود بیشترین میزان را دارند اختصاص دهید. موثر است.
وقتی به آن فکر می کنید، همه داده ها در نتیجه فرآیندی شبیه به یک الگوریتم وجود دارند. ، اغلب A.I. گاهی A.I. این فرآیند جمعآوری دادهها را تقویت میکند، گاهی اوقات اینطور نیست، و گاهی اوقات تمایز آنقدر واضح نیست. برای مثال، دادههای مربوط به میانگین درآمد و الگوهای مخارج را در جغرافیایی که هدف آن است، در نظر بگیرید: این دادهها میتواند از ترکیبی از نظرسنجیها، دادههای دولتی، دادههایی که توسط شرکتهای کارت اعتباری و بازرگانان خرد شده و سپس دوباره به یک عدد واحد تبدیل شود، به دست آید. یک بلوک سرشماری واحد، که الگوریتمهای بازاریابی شما ممکن است از آن برای کمک به شما برای هدفگیری مشتریان مختلف به روشهای مختلف استفاده کنند.
ما تمایل داریم به دادهها بهعنوان لزوماً درست و غیرمتکی باور کنیم. روی یک انسان یا A.I. روند به همین شکل باشد. اما این اغلب نادرست است. اگر میخواهید به نتایج معنیداری برسید، باید دادههای تغذیهکننده مدلهایتان را موشکافی کنید – و همچنین مدلهایی که دادههایی را تولید میکنند که شما به مدلهایتان تغذیه میکنید.
پری میگوید: «بزرگترین چیزی که من مشکلاتی را در مورد آن میبینم، کیفیت داده است. “هر چیزی که در فرآیند تصمیم گیری قرار می گیرد باید از نظر تمیزی، سوگیری و سایر مسائل بررسی شود – به ویژه در مورد مدل های یادگیری ماشین.”
درک این رفت و آمد بین داده ها و A.I. و حلقه بازخورد آنها به شما کمک میکند از تکیه بر تحلیلهایی که آنطور که در نگاه اول به نظر میرسد خوب نیستند اجتناب کنید.
نشان می دهد