"يحصل عالم البيانات الرائع على أجر مثل الرئيس التنفيذي لشركة متوسطة." خبير التعلم الآلي في Yandex.Taxi يتحدث عن كيفية تنبؤ البيانات بالمستقبل وتشكيل العالم

كجزء من المشروع المشترك "ABC of AI" مع MIPT، كتبنا بالفعل عن ما يسمى بالبرامج التي تسمح لك "بتنمية" البرامج وفقًا لمبادئ وقوانين التطور الدارويني. ومع ذلك، في الوقت الحالي، فإن هذا النهج في التعامل مع الذكاء الاصطناعي هو بالتأكيد “ضيف من المستقبل”. ولكن كيف يتم إنشاء أنظمة الذكاء الاصطناعي اليوم؟ كيف يتم تدريبهم؟ ساعدنا فيكتور كانتور، كبير المحاضرين في قسم الخوارزميات وتقنيات البرمجة في MIPT، ورئيس مجموعة تحليل سلوك المستخدم في Yandex Data Factory، في معرفة ذلك.

وفقًا لتقرير حديث صادر عن شركة الأبحاث Gartner، التي تقوم بانتظام بتحديث "دورة نضج التكنولوجيا"، فإن التعلم الآلي حاليًا في ذروة التوقعات في جميع تكنولوجيا المعلومات. وهذا ليس مفاجئا: على مدى السنوات القليلة الماضية، خرج التعلم الآلي من نطاق اهتمامات دائرة ضيقة من علماء الرياضيات والمتخصصين في نظرية الخوارزميات وتغلغل أولا في مفردات رجال أعمال تكنولوجيا المعلومات، ثم في العالم من الناس العاديين. الآن، أي شخص استخدم تطبيق Prisma، أو بحث عن الأغاني باستخدام Shazam، أو شاهد الصور التي تم تمريرها عبر DeepDream، يعرف أن هناك شيئًا مثل الشبكات العصبية ذات "سحرها" الخاص.

ومع ذلك، فإن استخدام التكنولوجيا شيء، وفهم كيفية عملها شيء آخر. الكلمات العامة مثل "يمكن للكمبيوتر أن يتعلم إذا أعطيته تلميحًا" أو "تتكون الشبكة العصبية من خلايا عصبية رقمية وهي منظمة مثل الدماغ البشري" قد تساعد شخصًا ما، ولكنها في كثير من الأحيان لا تؤدي إلا إلى إرباك الموقف. أولئك الذين سيدرسون الرياضيات بجدية لا يحتاجون إلى نصوص شائعة: فهناك كتب مدرسية ودورات ممتازة عبر الإنترنت لهم. سنحاول اتخاذ طريق وسط: شرح كيفية حدوث التعلم فعليًا من خلال مهمة بسيطة جدًا، ثم إظهار كيف يمكن تطبيق نفس النهج لحل مشكلات حقيقية مثيرة للاهتمام.

كيف تتعلم الآلات

في البداية، من أجل فهم كيفية حدوث التعلم الآلي بالضبط، دعونا نحدد المفاهيم. وكما عرّفه أحد رواد هذا المجال، آرثر صموئيل، يشير التعلم الآلي إلى الأساليب التي "تسمح لأجهزة الكمبيوتر بالتعلم دون برمجتها بشكل مباشر". هناك فئتان عريضتان من أساليب التعلم الآلي: التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. يتم استخدام الأول عندما نحتاج، على سبيل المثال، إلى تعليم الكمبيوتر كيفية البحث عن الصور التي تحتوي على صور القطط، والثاني عندما نحتاج إلى الجهاز، على سبيل المثال، لنتمكن من تجميع الأخبار بشكل مستقل في قصص، كما يحدث في الخدمات مثل Yandex.News أو أخبار Google. أي أننا في الحالة الأولى نتعامل مع مهمة تتضمن وجود إجابة صحيحة (إما أن تكون هناك قطة في الصورة أم لا)، وفي الحالة الثانية لا توجد إجابة واحدة صحيحة، ولكن هناك طرق مختلفة لحل المشكلة. سنركز بشكل خاص على الدرجة الأولى من المشاكل باعتبارها الأكثر إثارة للاهتمام.

لذلك نحن بحاجة إلى تعليم الكمبيوتر كيفية القيام ببعض التنبؤات. علاوة على ذلك، من المستحسن أن تكون دقيقًا قدر الإمكان. يمكن أن تكون التنبؤات من نوعين: إما أن تحتاج إلى الاختيار بين عدة خيارات للإجابة (سواء كان هناك قطة في الصورة أم لا هو اختيار خيار واحد من اثنين، والقدرة على التعرف على الحروف في الصور هو اختيار خيار واحد) من بين العشرات، وما إلى ذلك)، أو قم بالتنبؤ العددي. على سبيل المثال، توقع وزن الشخص بناءً على طوله وعمره ومقاس حذائه وما إلى ذلك. يبدو هذان النوعان من المشاكل مختلفين، ولكن في الواقع يتم حلهما بشكل متطابق تقريبًا. دعونا نحاول أن نفهم بالضبط كيف.

أول شيء نحتاجه لإنشاء نظام تنبؤ هو جمع ما يسمى بعينة التدريب، أي بيانات عن وزن الأشخاص في السكان. والثاني هو تحديد مجموعة من العلامات التي يمكننا على أساسها استخلاص استنتاجات حول الوزن. من الواضح أن إحدى هذه العلامات "الأقوى" ستكون طول الشخص، لذا يكفي أن نأخذ هذا فقط كتقدير أولي. إذا كان الوزن يعتمد خطيًا على الطول، فسيكون توقعنا بسيطًا للغاية: سيكون وزن الشخص مساويًا لطوله مضروبًا في بعض المعاملات، بالإضافة إلى بعض القيمة الثابتة، والتي يتم كتابتها بأبسط صيغة y=kx+b. كل ما يتعين علينا القيام به لتدريب الآلة على التنبؤ بوزن الشخص هو بطريقة أو بأخرى العثور على القيم الصحيحة لـ k وb.

يكمن جمال التعلم الآلي في أنه حتى لو كانت العلاقة التي ندرسها معقدة للغاية، فلن يتغير شيء في نهجنا. سنظل نتعامل مع نفس الانحدار.

لنفترض أن وزن الإنسان يتأثر بطوله ليس خطياً، بل إلى الدرجة الثالثة (وهو أمر متوقع عموماً، لأن الوزن يعتمد على حجم الجسم). لأخذ هذا الاعتماد في الاعتبار، نقوم ببساطة بإدخال حد آخر في معادلتنا، وهو القوة الثالثة للنمو مع معاملها الخاص، وبالتالي نحصل على y=k 1 x+k 2 x 3 +b. الآن، لتدريب الآلة، سنحتاج إلى العثور على ثلاث كميات، وليس اثنين (ك 1، ك 2 وب). لنفترض أننا في توقعاتنا نريد أيضًا أن نأخذ في الاعتبار حجم حذاء الشخص، وعمره، والوقت الذي يقضيه في مشاهدة التلفزيون، والمسافة من شقته إلى أقرب مطعم للوجبات السريعة. لا مشكلة: نحن ببساطة نضيف هذه الميزات كمصطلحات منفصلة في نفس المعادلة.

الشيء الأكثر أهمية هو إنشاء طريقة عالمية للعثور على المعاملات المطلوبة (k 1، k 2، ... k n). إذا كانت موجودة، فلن نبالي تقريبًا بالميزات التي يجب استخدامها للتنبؤ، لأن الآلة نفسها ستتعلم إعطاء وزن كبير للميزات المهمة، ووزن صغير للميزات غير المهمة. لحسن الحظ، تم اختراع مثل هذه الطريقة بالفعل ويعمل عليها كل التعلم الآلي تقريبًا بنجاح: بدءًا من أبسط النماذج الخطية وانتهاءً بأنظمة التعرف على الوجوه ومحللات الكلام. وتسمى هذه الطريقة النسب التدرج. ولكن قبل شرح كيفية عملها، نحتاج إلى إجراء استطراد بسيط والحديث عن الشبكات العصبية.

الشبكات العصبية

في عام 2016، دخلت الشبكات العصبية أجندة المعلومات بشكل وثيق لدرجة أنها أصبحت تقريبًا مرتبطة بأي تعلم آلي وتكنولوجيا المعلومات المتقدمة بشكل عام. من الناحية الرسمية، هذا غير صحيح: لا تُستخدم الشبكات العصبية دائمًا في تعلم الرياضيات؛ فهناك تقنيات أخرى. ولكن بشكل عام، بطبيعة الحال، فإن مثل هذا الارتباط مفهوم، لأن الأنظمة القائمة على الشبكات العصبية هي التي توفر الآن النتائج الأكثر "سحرية"، مثل القدرة على البحث عن شخص في الصورة، وظهور التطبيقات التي تنقل أسلوب صورة إلى أخرى، أو أنظمة توليد النصوص بطريقة كلام شخص معين.

الطريقة التي يتم بها بناء الشبكات العصبية، نحن بالفعل... هنا أريد فقط التأكيد على أن قوة الشبكات العصبية مقارنة بأنظمة التعلم الآلي الأخرى تكمن في طبيعتها متعددة الطبقات، لكن هذا لا يجعلها مختلفة جذريًا في طريقة عملها. تتيح لك الطبقات المتعددة حقًا العثور على ميزات عامة مجردة وتبعيات في مجموعات معقدة من الميزات، مثل وحدات البكسل في الصورة. ولكن من المهم أن نفهم أنه من وجهة نظر مبادئ التعلم، فإن الشبكة العصبية لا تختلف جذريًا عن مجموعة من صيغ الانحدار الخطي التقليدية، لذا فإن نفس طريقة النسب المتدرج تعمل بشكل رائع هنا أيضًا.

تكمن "قوة" الشبكة العصبية في وجود طبقة وسيطة من الخلايا العصبية، والتي تجمع بشكل موجز قيم طبقة الإدخال. ولهذا السبب، يمكن للشبكات العصبية أن تجد ميزات مجردة للغاية في البيانات التي يصعب اختزالها إلى صيغ بسيطة مثل العلاقة الخطية أو التربيعية.

دعونا نشرح مع مثال. لقد استقرينا على توقع يعتمد فيه وزن الشخص على طوله وطوله المكعب، وهو ما يتم التعبير عنه بالصيغة y=k 1 x+k 2 x 3 +b. مع بعض الامتداد، ولكن في الواقع، حتى هذه الصيغة يمكن أن تسمى شبكة عصبية. فيها، كما هو الحال في الشبكة العصبية العادية، هناك طبقة أولى من "الخلايا العصبية"، وهي أيضًا طبقة من الميزات: هذه هي x وx 3 (حسنًا، "وحدة الخلية العصبية" التي نضعها في الاعتبار والتي من أجلها المعامل ب هو المسؤول). يتم تمثيل الطبقة العليا أو الناتجة بواسطة "خلية عصبية" واحدة، أي الوزن المتوقع للشخص. وبين الطبقتين الأولى والأخيرة من "الخلايا العصبية" هناك اتصالات، يتم تحديد قوتها أو وزنها من خلال المعاملات k 1 و k 2 و b. إن تدريب هذه "الشبكة العصبية" يعني ببساطة إيجاد نفس المعاملات.

والفرق الوحيد هنا عن الشبكات العصبية "الحقيقية" هو أننا لا نملك طبقة متوسطة (أو مخفية) واحدة من الخلايا العصبية، والتي تتمثل مهمتها في الجمع بين ميزات الإدخال. يتيح لك إدخال مثل هذه الطبقات عدم اختراع التبعيات المحتملة بين الميزات الموجودة "خارج رأسك"، ولكن الاعتماد على مجموعاتها الموجودة بالفعل في الشبكة العصبية. على سبيل المثال، يمكن أن يكون للعمر ومتوسط ​​الوقت الذي يقضيه أمام التلفزيون تأثير تآزري على وزن الشخص، ولكن بوجود شبكة عصبية، لا يتعين علينا معرفة ذلك مسبقًا وإدخال منتجهم في الصيغة. في الشبكة العصبية، سيكون هناك بالتأكيد خلية عصبية تجمع بين تأثير أي ميزتين، وإذا كان هذا التأثير ملحوظًا حقًا في العينة، فبعد التدريب، ستتلقى هذه الخلية العصبية وزنًا كبيرًا تلقائيًا.

نزول التدرج

لذلك، لدينا مجموعة تدريبية من الأمثلة ذات البيانات المعروفة، أي جدول يحتوي على وزن شخص تم قياسه بدقة، وبعض فرضيات العلاقة، في هذه الحالة الانحدار الخطي y=kx+b. مهمتنا هي العثور على القيم الصحيحة لـ k وb، ليس يدويًا، بل تلقائيًا. ويفضل أن تكون طريقة عالمية لا تعتمد على عدد المعلمات المضمنة في الصيغة.

بشكل عام، ليس من الصعب القيام بذلك. الفكرة الرئيسية هي إنشاء دالة تقيس مستوى الخطأ الإجمالي الحالي و"تعديل" المعاملات بحيث ينخفض ​​مستوى الخطأ الإجمالي تدريجيًا. كيف يمكنني خفض مستوى الخطأ؟ نحن بحاجة إلى تعديل معلماتنا في الاتجاه الصحيح.

تخيل أن المعلمتين اللتين نبحث عنهما، هما نفس k وb، كإتجاهين على المستوى، مثل المحور الشمالي الجنوبي والمحور الغربي الشرقي. كل نقطة على هذا المستوى سوف تتوافق مع قيمة معينة من المعاملات، وعلاقة معينة بين الطول والوزن. ولكل نقطة على المستوى، يمكننا حساب مستوى الخطأ الإجمالي الذي يعطيه هذا التنبؤ لكل مثال من الأمثلة في عينتنا.

اتضح شيئًا مثل ارتفاع معين على متن الطائرة، وتبدأ المساحة المحيطة بأكملها في تشبه المناظر الطبيعية الجبلية. الجبال هي النقاط التي يكون فيها معدل الخطأ مرتفعًا جدًا، والوديان هي الأماكن التي تقل فيها الأخطاء. ومن الواضح أن تدريب نظامنا يعني العثور على أدنى نقطة على الأرض، وهي النقطة التي يكون فيها معدل الخطأ في حده الأدنى.

كيف يمكنك أن تجد هذه النقطة؟ الطريقة الصحيحة هي التحرك طوال الوقت للأسفل من النقطة التي وجدنا أنفسنا فيها في البداية. لذلك، عاجلاً أم آجلاً، سوف نصل إلى الحد الأدنى المحلي - وهي النقطة التي لا يوجد أدناه أي شيء في المنطقة المجاورة مباشرة. علاوة على ذلك، يُنصح باتخاذ خطوات بأحجام مختلفة: عندما يكون المنحدر شديد الانحدار، يمكنك اتخاذ خطوات أوسع؛ وعندما يكون المنحدر صغيرًا، فمن الأفضل التسلل إلى الحد الأدنى المحلي "على رؤوس أصابعك"، وإلا قد تتجاوز الحد.

هذه هي بالضبط الطريقة التي تعمل بها طريقة النزول المتدرج: نقوم بتغيير أوزان المعالم في اتجاه أكبر انخفاض في دالة الخطأ. نقوم بتغييرها بشكل متكرر، أي بخطوة معينة تتناسب قيمتها مع انحدار المنحدر. المثير للاهتمام هو أنه عندما يزيد عدد الميزات (إضافة مكعب من طول الشخص وعمره وحجم حذائه وما إلى ذلك)، لا يتغير شيء في الأساس، كل ما في الأمر أن المشهد الطبيعي لدينا لا يصبح ثنائي الأبعاد، بل متعدد الأبعاد.

يمكن تعريف دالة الخطأ على أنها مجموع مربعات جميع الانحرافات التي تسمح بها الصيغة الحالية للأشخاص الذين نعرف وزنهم بالضبط بالفعل. لنأخذ بعض المتغيرات العشوائية k وb، على سبيل المثال 0 و50. ثم سيتنبأ لنا النظام أن وزن كل شخص في العينة يساوي دائمًا 50 كيلوجرامًا y=0×x+50 على الرسم البياني، مثل هذا سيبدو الاعتماد كخط مستقيم موازٍ للأفقي. من الواضح أن هذا ليس توقعًا جيدًا جدًا. الآن لنأخذ الانحراف في الوزن عن هذه القيمة المتوقعة، ونقوم بتربيعه (بحيث يتم أخذ القيم السالبة في الاعتبار أيضًا) ونلخصه - سيكون هذا هو الخطأ في هذه المرحلة. إذا كنت على دراية ببدايات التحليل، فيمكنك حتى توضيح أن اتجاه الهبوط الأكبر يُعطى بواسطة المشتق الجزئي لدالة الخطأ بالنسبة إلى k وb، والخطوة هي قيمة يتم اختيارها لـ أسباب عملية: تستغرق الخطوات الصغيرة وقتًا طويلاً لحسابها، ويمكن أن تؤدي الخطوات الكبيرة إلى حقيقة أننا سنتجاوز الحد الأدنى.

حسنًا، ماذا لو لم يكن لدينا انحدار معقد به العديد من الميزات فحسب، بل شبكة عصبية حقيقية؟ كيف نطبق النسب المتدرج في هذه الحالة؟ اتضح أن النزول المتدرج يعمل بنفس الطريقة تمامًا مع الشبكة العصبية، ويتم التدريب فقط 1) خطوة بخطوة، من طبقة إلى طبقة و2) تدريجيًا، من مثال في العينة إلى آخر. الطريقة المستخدمة هنا تسمى الانتشار العكسي، وقد تم وصفها بشكل مستقل في عام 1974 من قبل عالم الرياضيات السوفييتي ألكسندر جالوشكين وعالم الرياضيات بجامعة هارفارد بول جون ويبروس.

على الرغم من أنه من أجل عرض صارم للخوارزمية، سيكون من الضروري كتابة مشتقات جزئية (على سبيل المثال)، إلا أن كل شيء يحدث على المستوى البديهي بكل بساطة: لكل مثال من الأمثلة في العينة، لدينا تنبؤ معين عند الإخراج للشبكة العصبية. بالحصول على الإجابة الصحيحة، يمكننا طرح الإجابة الصحيحة من التنبؤ وبالتالي الحصول على خطأ (بتعبير أدق، مجموعة من الأخطاء لكل خلية عصبية في طبقة الإخراج). نحتاج الآن إلى نقل هذا الخطأ إلى الطبقة السابقة من الخلايا العصبية، وكلما زادت مساهمة هذه الخلية العصبية في هذه الطبقة في الخطأ، كلما زادت حاجتنا إلى تقليل وزنها (في الواقع، نتحدث مرة أخرى عن أخذ المشتق الجزئي، حول التحرك على طول أقصى درجة من الانحدار في مشهدنا الخيالي). عندما نقوم بذلك، يجب تكرار نفس الإجراء للطبقة التالية، والتحرك في الاتجاه المعاكس، أي من مخرج الشبكة العصبية إلى الإدخال.

من خلال المرور عبر الشبكة العصبية بهذه الطريقة مع كل مثال لعينة التدريب و"تحريف" أوزان الخلايا العصبية في الاتجاه المطلوب، يجب أن نحصل في النهاية على شبكة عصبية مدربة. تعد طريقة الانتشار العكسي بمثابة تعديل بسيط لطريقة النسب المتدرج للشبكات العصبية متعددة الطبقات، وبالتالي يجب أن تعمل مع الشبكات العصبية بأي تعقيد. نقول "ينبغي" هنا لأنه في الواقع هناك حالات يفشل فيها النزول المتدرج ولا يسمح لك بإجراء انحدار جيد أو تدريب شبكة عصبية. قد يكون من المفيد معرفة سبب ظهور مثل هذه الصعوبات.

صعوبات الهبوط المتدرج

اختيار خاطئ للحد الأدنى المطلق.تساعد طريقة النسب المتدرج في البحث عن الحد الأقصى المحلي. لكن لا يمكننا دائمًا استخدامها لتحقيق الحد الأدنى أو الحد الأقصى الشامل للدالة. يحدث هذا لأنه عند التحرك على طول مضاد التدرج، نتوقف عند اللحظة التي نصل فيها إلى الحد الأدنى المحلي الأول الذي نواجهه، وتتوقف الخوارزمية عن العمل.

تخيل أنك واقف على قمة جبل. إذا كنت تريد النزول إلى أدنى سطح في المنطقة، فإن طريقة النزول المتدرج لن تساعدك دائمًا، لأن أول نقطة منخفضة في طريقك لن تكون بالضرورة أدنى نقطة. وإذا كنت قادرًا في الحياة على رؤية أنه إذا صعدت قليلاً ثم يمكنك بعد ذلك النزول إلى مستوى أقل، فإن الخوارزمية في مثل هذه الحالة ستتوقف ببساطة. في كثير من الأحيان يمكن تجنب هذا الموقف إذا اخترت الخطوة الصحيحة.

اختيار خطوة غير صحيحة.طريقة النسب المتدرج هي طريقة تكرارية. أي أننا نحتاج بأنفسنا إلى اختيار حجم الخطوة - السرعة التي ننزل بها. باختيار خطوة كبيرة جدًا، قد نتجاوز الحد الأقصى الذي نحتاجه ولا نجد الحد الأدنى. يمكن أن يحدث هذا إذا وجدت نفسك تواجه هبوطًا حادًا للغاية. واختيار خطوة صغيرة جدًا يخاطر بجعل الخوارزمية بطيئة للغاية إذا وجدنا أنفسنا على سطح مستوٍ نسبيًا. إذا تخيلنا مرة أخرى أننا على قمة جبل شديد الانحدار، فقد ينشأ موقف حيث، بسبب نزول شديد الانحدار بالقرب من الحد الأدنى، فإننا ببساطة نطير فوقه.

شلل الشبكة.يحدث أحيانًا أن تفشل طريقة النزول المتدرج في العثور على الحد الأدنى على الإطلاق. يمكن أن يحدث هذا إذا كانت هناك مناطق مسطحة على جانبي الحد الأدنى - الخوارزمية، عندما تصل إلى منطقة مسطحة، تقلل الخطوة وتتوقف في النهاية. إذا قررت، أثناء وقوفك على قمة جبل، التحرك نحو منزلك في الأراضي المنخفضة، فقد تكون الرحلة طويلة جدًا إذا تجولت بطريق الخطأ في منطقة مسطحة جدًا. أو، إذا كانت هناك "منحدرات" رأسية تقريبًا على طول حواف المناطق المسطحة، فإن الخوارزمية، بعد اختيار خطوة كبيرة جدًا، ستقفز من منحدر إلى آخر، ولا تتحرك عمليًا نحو الحد الأدنى.

يجب أن تؤخذ كل هذه القضايا المعقدة في الاعتبار عند تصميم نظام التعلم الآلي. على سبيل المثال، من المفيد دائمًا تتبع كيفية تغير وظيفة الخطأ بمرور الوقت - هل تقع مع كل دورة جديدة أو وقت تحديد، وكيف تتغير طبيعة هذا الخريف اعتمادًا على التغيير في حجم الخطوة. لتجنب الوقوع في الحد الأدنى المحلي السيئ، قد يكون من المفيد البدء من نقاط مختلفة تم اختيارها عشوائيًا من المشهد - عندها يكون احتمال التعثر أقل بكثير. هناك العديد من الأسرار الكبيرة والصغيرة لاستخدام النسب المتدرج، وهناك أيضًا طرق أكثر غرابة للتعلم تشبه إلى حد ما النزول المتدرج. لكن هذا موضوع لمحادثة أخرى ومقال منفصل في إطار مشروع ABC of AI.

من إعداد ألكسندر إرشوف

لقد مر عام تقريبًا منذ اللحظة التي بدأ فيها موضوع غير عادي - ورشة عمل مبتكرة - في FIVT. جوهرها هو إنشاء شركات تكنولوجيا المعلومات الناشئة من قبل فرق الطلاب تحت إشراف الموجهين ذوي الخبرة. لقد اتضح الأمر جيدًا: بفضل الدورة، قضى شخص ما جزءًا من الصيف في وادي كريم، وحصل شخص ما على منحة بمبلغ 800000 روبل لتطوير المشروع، وABBYY مستعدة لشراء المشروع بالكامل من شخص ما. وهذه ليست كل نتائج الورشة!

في بداية عام 2011، تم جمع طلاب السنة الثالثة من FIVT في قاعة الجمعية وأخبروا: خلال العام المقبل، ستحتاج إلى إنشاء بدء التشغيل الخاص بك. لم يقبل الطلاب هذه الفكرة بشكل غامض: لم يكن من الواضح كيفية القيام بذلك على الإطلاق، وكانت المسؤولية غير عادية - بعد كل شيء، كان من الضروري إنشاء عمل تجاري تكنولوجي، وليس مجرد مشروع تعليمي آخر. إليك ما يفكر فيه الفائز في أولمبياد MIPT الطلابي في الفيزياء، طالب قسم يانديسكا، فيكتور كانتور:

عندما اخترت FIVT عند القبول، كنت آمل أن يكون لدينا شيء مماثل. لذلك أنا سعيد لأن آمالي لم تذهب سدى. خلال العام، كان هناك شعور بأن الدورة لا تزال قيد التشكيل، وكان هناك الكثير من الأشياء الجديدة فيها، وكانت العديد من القضايا مثيرة للجدل ليس فقط للطلاب، ولكن أيضًا للمنظمين، ولكن بشكل عام، أعتقد أن الاتجاهات إيجابية. اعجبني هذه الدورة.

لتسهيل عمل الطلاب، تمت دعوة العديد من القيمين لتقديم أفكارهم لبناء أعمال تجارية مبتكرة. وكان من بينهم أشخاص مختلفون تمامًا: من الطلاب الجامعيين وطلاب الدراسات العليا في MIPT إلى مستشار الابتكار في Ernst&Young يوري بافلوفيتش أموسوف (كان قائد الدورة بأكملها) وميخائيل باتين، الذي يتعامل مع قضايا الطب التجديدي وإطالة الحياة. ونتيجة لذلك، اختار طلاب الفيزياء والتكنولوجيا الأفكار الأكثر إثارة للاهتمام بالنسبة لهم، وانضم القيمون إلى الفرق، وبدأ العمل الشاق ولكن المثير.

وفي ما يقرب من عام مضى منذ ذلك الحين، واجه الشباب العديد من المشاكل، تم حل بعضها. الآن يمكننا تقييم نتائجهم - على الرغم من الصعوبات، تعامل الرجال. تمكن طلاب MIPT (بالإضافة إلى كلية الفلسفة، انضم بعض الطلاب من كلية فقه اللغة وكليات أخرى إلى العملية) من إعداد العديد من المشاريع المثيرة للاهتمام والقابلة للتطبيق:

Askeroid (المعروف سابقًا باسم Ask Droid) – ابحث عن الهواتف الذكية ( اناستازيا يورياشيفا)

تطبيق Android يسمح لك بالبحث بسهولة في عدد كبير من محركات البحث. أبدى بعض الخبراء اهتمامًا بالتنمية، ونتيجة لذلك، أمضت أنستازيا الصيف الماضي بأكمله في واحدة من أشهر الحاضنات في وادي السيليكون - Plug&Play. تعلم أساسيات ريادة الأعمال التكنولوجية والتحدث مع خبراء المشاريع الدوليين.

1دقيقة.ru - دقيقة واحدة للخير (ليف جرونين)

يتيح هذا المشروع لأي شخص الفرصة للقيام بالأعمال الخيرية ببساطة وسرعة وبشكل مجاني تمامًا. النموذج بسيط: يقدم المعلنون مجموعة معينة من الأنشطة على الموقع، ويشارك فيها المستخدمون طوعا، ويتم تحويل جميع الأموال الناتجة عن الإعلانات إلى مؤسسة خيرية. وفي غضون أسبوع من إطلاقه، جمع المشروع أكثر من 6500 مستخدم ولن يتوقف عند هذا الحد. ونتيجة لذلك، وبفضل ليف وفريقه، سيحصل 600 طفل من دور الأيتام على هدايا عزيزة من سانتا كلوز للعام الجديد. هل سبق لك أن أمضيت دقيقة واحدة في عمل صالح؟!

سطح المكتب المضمن - جهاز كمبيوتر في هاتفك (أليكسي فوكولوف)

تطبيق يتيح لك الجمع بين إمكانيات الكمبيوتر وإمكانية تنقل الهاتف في حزمة واحدة - منتج مفيد للغاية للأشخاص المشغولين الذين يسافرون غالبًا في رحلات عمل. يكفي تثبيته على هاتف ذكي، وسيتمكن المستخدم من "الحصول" على جهاز الكمبيوتر الخاص به في أي فندق أو مكتب أو في الواقع في أي مكان يمكنه العثور فيه على شاشة (جهاز تلفزيون مناسب أيضًا) ولوحة مفاتيح وجهاز كمبيوتر. الفأر. حصل المشروع على منحة لتطوير الفكرة وتم تقديمه في معرض كأس تكنوفيشن، وبالأموال المستلمة، يقوم الفريق بالفعل بشراء المعدات بنشاط. تهتم الشركة المصنعة للمعالجات الأمريكية MIPS بشدة بالتطوير.

Smart Tagger – البحث الدلالي من خلال المستندات (فيكتور كانتور)

ماذا يجب أن تفعل إذا تذكرت أنه في مكان ما في صندوق البريد الخاص بك كان هناك خطاب مهم للغاية يتحدث عن الحلقة الأخيرة من Big Bang Theory، لكنك لا تتذكر أي كلمات رئيسية من النص؟ بحث Yandex و Google عاجزان. سيأتي تطوير Smart Tagger إلى الإنقاذ - فالبرنامج "الذكي" الذي يستخدم البحث الدلالي سيوفر لك جميع النصوص التي يتشابك معناها مع المسلسل التلفزيوني الشهير. حصل المشروع على منحة في مسابقة U.M.N.I.K. بإجمالي 400000 روبل!

MathOcr - التعرف على الصيغة (فيكتور برون)

اقترحت ABBYY مهمة تنفيذ مثيرة للاهتمام - وهي إنشاء برنامج يتعرف على الصيغ الرياضية بأي تعقيد. أكمل طلاب FIVT، بالتعاون مع الطلاب المهتمين، المهمة - تتعرف الوحدة بالفعل على الصيغ الممسوحة ضوئيًا من الكتب المدرسية في الرياضيات أو الفيزياء. النتيجة: ABBYY على استعداد لشراء هذا المنتج مقابل مبلغ كبير من المال.

- هل يمكنك استخدام مثال بدائي تمامًا لتخبرنا كيف يعمل التعلم الآلي؟

يستطيع. هناك مثال على تقنية التعلم الآلي تسمى Decision Tree، وهي واحدة من أقدم الأشياء. دعونا نفعل ذلك الآن. لنفترض أن شخصًا مجردًا يطلب منك الخروج في موعد. ما المهم بالنسبة لك؟

- أولاً، سواء كنت أعرفه أم لا..

(يكتب فيكتور هذا على السبورة.)

...إذا لم أكن أعرف، فأنا بحاجة للإجابة على سؤال ما إذا كان جذابًا أم لا.

وإذا كنت تعرف، فلا يهم؟ أعتقد أنني فهمت هذا، هذا هو موضوع منطقة الأصدقاء! بشكل عام، أنا أكتب، إذا كنت لا تعرف وهو غير جذاب، فالإجابة هي "لا، على الأرجح". إذا كنت تعرف، فإن الجواب هو "نعم".

- إذا كنت أعرف، فهذا مهم أيضًا!

لا، سيكون هذا فرع منطقة الأصدقاء.

حسنًا، فلنوضح هنا ما إذا كان الأمر مثيرًا للاهتمام أم لا. ومع ذلك، عندما لا تعرف شخصًا ما، فإن أول رد فعل هو المظهر مع أحد معارفه، فنحن ننظر بالفعل إلى ما يفكر فيه وكيف.

دعونا نفعل ذلك بشكل مختلف. سواء كان طموحا أم لا. إذا كان طموحًا، فسيكون من الصعب صداقته، لأنه سيريد المزيد. لكن غير الطموح سوف يستمر.

(ينتهي فيكتور من رسم الشجرة الحاسمة.)

مستعد. الآن يمكنك التنبؤ بالشخص الذي من المرجح أن تذهب معه في موعد. بالمناسبة، تتنبأ بعض خدمات المواعدة بمثل هذه الأشياء. وعلى سبيل القياس، يمكنك التنبؤ بعدد السلع التي سيشتريها العملاء، وأين سيكون الناس في ذلك الوقت من اليوم.

الإجابات لا يمكن أن تكون فقط "نعم" و"لا"، ولكن أيضًا في شكل أرقام. إذا كنت تريد توقعات أكثر دقة، فيمكنك إنشاء العديد من هذه الأشجار ومتوسطها. وبمساعدة شيء بسيط كهذا، يمكنك التنبؤ بالمستقبل.

تخيل الآن، هل كان من الصعب على الناس أن يتوصلوا إلى مثل هذا المخطط قبل مائتي عام؟ بالطبع لا! هذا المخطط لا يحمل أي علم الصواريخ. كظاهرة، التعلم الآلي موجود منذ حوالي نصف قرن. بدأ رونالد فيشر في وضع التنبؤات بناءً على البيانات في بداية القرن العشرين. أخذ زهور السوسن ووزعها حسب طول وعرض الكأسية والبتلات، وباستخدام هذه المعلمات حدد نوع النبات.

في الصناعة، تم استخدام التعلم الآلي بنشاط في العقود الأخيرة: ظهرت منذ وقت ليس ببعيد آلات قوية وغير مكلفة نسبيًا مطلوبة لمعالجة كميات كبيرة من البيانات، على سبيل المثال، لأشجار القرار هذه. لكن الأمر لا يزال مثيرًا: فنحن نرسم هذه الأشياء لكل مهمة ونستخدمها للتنبؤ بالمستقبل.

- حسنًا، بالتأكيد ليس أفضل من أي أخطبوط يتنبأ بمباريات كرة القدم...

لا، ما الذي يهمنا في الأخطبوطات؟ على الرغم من أن لدينا المزيد من التباين. الآن، بمساعدة التعلم الآلي، يمكنك توفير الوقت والمال وتحسين راحة الحياة. لقد تفوق التعلم الآلي على البشر منذ بضع سنوات عندما يتعلق الأمر بتصنيف الصور. على سبيل المثال، يستطيع الكمبيوتر التعرف على 20 سلالة من سلالات الترير، لكن الشخص العادي لا يستطيع ذلك.

- وعندما تقوم بتحليل المستخدمين، هل كل شخص يمثل مجموعة من الأرقام بالنسبة لك؟

بشكل تقريبي، نعم. عندما نعمل مع البيانات، يتم وصف جميع الكائنات، بما في ذلك سلوك المستخدم، من خلال مجموعة معينة من الأرقام. وتعكس هذه الأرقام خصائص سلوك الناس: عدد المرات التي يستقلون فيها سيارة أجرة، وفئة سيارة الأجرة التي يستخدمونها، والأماكن التي يذهبون إليها عادة.

نحن نعمل الآن بنشاط على بناء نماذج متشابهة لاستخدامها في تحديد مجموعات من الأشخاص ذوي السلوك المماثل. عندما نقدم خدمة جديدة أو نريد الترويج لخدمة قديمة، فإننا نقدمها لمن يهمه الأمر.

على سبيل المثال، لدينا الآن خدمة - مقعدين للأطفال في سيارة أجرة. يمكننا إرسال بريد عشوائي إلى الجميع بهذه الأخبار، أو يمكننا إبلاغها على وجه التحديد لدائرة معينة من الأشخاص فقط. على مدار العام، جمعنا عددًا من المستخدمين الذين كتبوا في التعليقات أنهم بحاجة إلى مقعدين للأطفال. لقد وجدناهم وأشخاصًا مشابهين لهم. تقليديًا، هؤلاء هم الأشخاص الذين تزيد أعمارهم عن 30 عامًا ويسافرون بانتظام ويحبون مطبخ البحر الأبيض المتوسط. على الرغم من وجود العديد من العلامات بالطبع، إلا أن هذا مجرد مثال.

- حتى هذه الدقيقة؟

هذه مسألة بسيطة. يتم حساب كل شيء باستخدام استعلامات البحث.

هل يمكن أن يعمل هذا بطريقة أو بأخرى في التطبيق؟ على سبيل المثال، هل تعلم أنني متسول وأشترك في مجموعات مثل "كيف أعيش على 500 روبل شهريًا" - إنهم يقدمون لي فقط سيارات رخيصة الثمن، ويشتركون في أخبار SpaceX - ومن وقت لآخر يبيعونني تسلا؟

قد يعمل بهذه الطريقة، ولكن مثل هذه الأشياء غير معتمدة في ياندكس، لأنها تمييز. عندما تقوم بتخصيص خدمة ما، فمن الأفضل ألا تقدم الخدمة الأكثر قبولًا، بل الأفضل المتاح وما يحبه الشخص. والتوزيع وفق منطق «هذا يحتاج إلى سيارة أفضل وهذا يحتاج إلى أقل جودة» هو شر.


كل شخص لديه رغبات منحرفة، وفي بعض الأحيان لا تحتاج إلى العثور على وصفة لطبق البحر الأبيض المتوسط، ولكن، على سبيل المثال، صور حول الكوبروفيليا. هل سيظل التخصيص يعمل في هذه الحالة؟

هناك دائمًا وضع خاص.

إذا كنت لا أريد أن يعرف أحد عن اهتماماتي، أو على سبيل المثال، يأتي الأصدقاء إلي ويريدون مشاهدة بعض المهملات، فمن الأفضل استخدام وضع التصفح المتخفي.

يمكنك أيضًا تحديد خدمة الشركة التي تريد استخدامها، على سبيل المثال، Yandex أو Google.

- هناك فرق؟

مسألة معقدة. لا أعرف شيئًا عن الآخرين، لكن Yandex صارمة فيما يتعلق بحماية البيانات الشخصية. تتم مراقبة الموظفين بشكل خاص.

- أي إذا انفصلت عن رجل فلن أتمكن من معرفة ما إذا كان قد ذهب إلى هذا الكوخ أم لا؟

حتى لو كنت تعمل في Yandex. هذا بالطبع أمر محزن، لكن نعم، لن يكون من الممكن معرفة ذلك. معظم الموظفين لا يستطيعون حتى الوصول إلى هذه البيانات. كل شيء مشفر. الأمر بسيط: لا يمكنك التجسس على الأشخاص، فهذه معلومات شخصية.

بالمناسبة، كان لدينا حالة مثيرة للاهتمام حول موضوع الانفصال عن الرجال. عندما قمنا بالتنبؤ بالنقطة "B" - نقطة الوجهة في سيارة الأجرة، قدمنا ​​تلميحات. انظر هنا.

(يقوم فيكتور بتسجيل الدخول إلى تطبيق Yandex.Taxi.)

على سبيل المثال، سيارة الأجرة تعتقد أنني في المنزل. يقترح أن أذهب إما إلى العمل أو إلى جامعة RUDN (ألقي محاضرات هناك كجزء من دورة التعلم الآلي Data Mining in Action). وفي مرحلة ما، أثناء تطوير هذه النصائح، أدركنا أننا بحاجة إلى تجنب تعريض المستخدم للخطر. يمكن لأي شخص رؤية النقطة ب. ولهذه الأسباب رفضنا اقتراح الأماكن على أساس التشابه. خلاف ذلك، تجلس في مكان لائق مع أشخاص محترمين، وتطلب سيارة أجرة، ويكتبون لك: "انظر، لم تذهب إلى هذا البار بعد!"

- ما هي تلك النقاط الزرقاء التي تومض على خريطتك؟

هذه هي نقاط الالتقاط. توضح هذه النقاط المكان الأكثر ملاءمة لاستدعاء سيارة أجرة. بعد كل شيء، يمكنك الاتصال بالمكان الذي سيكون من غير المناسب تماما الذهاب إليه. ولكن بشكل عام، يمكنك الاتصال في أي مكان.

- نعم في أي وقت. لقد طرت بطريقة ما على بعد كتلتين من هذا.

في الآونة الأخيرة، كانت هناك صعوبات مختلفة مع نظام تحديد المواقع العالمي (GPS)، مما أدى إلى العديد من المواقف المضحكة. تم نقل الأشخاص، على سبيل المثال، في تفرسكايا، عن طريق الملاحة عبر المحيط الهادئ. كما ترون، في بعض الأحيان هناك أخطاء وأكثر من كتلتين.

- وإذا قمت بإعادة تشغيل التطبيق والنقر مرة أخرى، يتغير السعر بعدة روبل. لماذا؟

إذا تجاوز الطلب العرض، تقوم الخوارزمية تلقائيًا بإنشاء معامل متزايد - وهذا يساعد أولئك الذين يحتاجون إلى المغادرة في أسرع وقت ممكن على استخدام سيارة أجرة، حتى خلال فترات ارتفاع الطلب. بالمناسبة، بمساعدة التعلم الآلي، يمكنك التنبؤ بالمكان الذي سيكون فيه الطلب أكبر، على سبيل المثال، في ساعة واحدة. يساعدنا هذا في إخبار السائقين بالمكان الذي سيكون فيه المزيد من الطلبات حتى يتطابق العرض مع الطلب.

- ألا تعتقد أن Yandex.Taxi سيقضي قريبًا على سوق سيارات الأجرة بأكمله؟

أعتقد لا. نحن مع المنافسة الصحية ولسنا خائفين منها.

على سبيل المثال، أنا نفسي أستخدم خدمات سيارات الأجرة المختلفة. وقت الانتظار مهم بالنسبة لي، لذلك أتصفح العديد من التطبيقات لمعرفة أي سيارة أجرة ستصل بشكل أسرع.


- لقد تعاونت مع اوبر. لماذا؟

ليس مكاني للتعليق. أعتقد أن الاتحاد هو قرار معقول للغاية.

في ألمانيا، قام أحد الأشخاص بتركيب حوض استحمام على طائرات بدون طيار وانطلق لتناول البرجر. هل تعتقد أن الوقت قد حان للسيطرة على المجال الجوي؟

لا أعرف شيئا عن المجال الجوي. نحن نتابع أخبارًا مثل «أوبر أطلقت سيارات أجرة على القوارب»، لكن لا أستطيع أن أقول شيئًا عن الهواء.

- وماذا عن سيارات الأجرة ذاتية القيادة؟

هناك نقطة مثيرة للاهتمام هنا. نحن نعمل على تطويرها، ولكننا بحاجة إلى التفكير في كيفية استخدامها بالضبط. من السابق لأوانه التنبؤ بأي شكل ومتى ستظهر في الشوارع، لكننا نبذل قصارى جهدنا لتطوير التكنولوجيا لسيارة ذاتية القيادة بالكامل، حيث لن تكون هناك حاجة إلى سائق بشري على الإطلاق.

- هل هناك مخاوف من اختراق برنامج الطائرة بدون طيار للتحكم في السيارة عن بعد؟

هناك مخاطر دائمًا وفي كل مكان حيث توجد التقنيات والأدوات. ولكن جنبا إلى جنب مع تطور التكنولوجيا، هناك اتجاه آخر يتطور - حمايتهم وسلامتهم. كل من يشارك بطريقة أو بأخرى في تطوير التكنولوجيا يعمل على أنظمة الأمان.

- ما هي بيانات المستخدم التي تجمعها وكيف تحميها؟

نقوم بجمع بيانات استخدام مجهولة المصدر، مثل مكان ومتى وأين تمت الرحلة. يتم تجزئة كل شيء مهم.

- هل تعتقد أن عدد الوظائف سينخفض ​​بسبب الطائرات بدون طيار؟

أعتقد أنها سوف تكبر فقط. ومع ذلك، تحتاج هذه الطائرات بدون طيار أيضًا إلى الصيانة بطريقة أو بأخرى. هذا، بالطبع، هو موقف مرهق بعض الشيء، يغير تخصصك، ولكن ماذا يمكنك أن تفعل؟

- في كل من محاضراته، يقول جريف أن الشخص سيغير مهنته بشكل جذري ثلاث مرات على الأقل.

لا أستطيع تسمية أي تخصص سيستمر إلى الأبد. لا يعمل المطور بنفس اللغة وبنفس التقنيات طوال حياته. في كل مكان نحن بحاجة إلى إعادة البناء. مع التعلم الآلي، أستطيع أن أشعر بوضوح كيف يمكن للأشخاص الذين هم أصغر مني بست سنوات أن يفكروا بشكل أسرع مني. وفي الوقت نفسه، يشعر الأشخاص الذين تتراوح أعمارهم بين 40 أو 45 عامًا بهذا بقوة أكبر.

- الخبرة لم تعد تلعب دورا؟

تلعب. لكن الأساليب تتغير، يمكنك أن تصل إلى منطقة، على سبيل المثال، لم يتم استخدام التعلم العميق فيها، وتعمل هناك لبعض الوقت، ثم يتم تقديم أساليب التعلم العميق في كل مكان، ولا تفهم شيئًا عنها. هذا كل شئ. يمكن أن تكون تجربتك مفيدة فقط في مسألة التخطيط لعمل الفريق، وحتى ذلك الحين ليس دائمًا.

- ومهنتك عالم بيانات، هل هي مطلوبة؟

الطلب على المتخصصين في علوم البيانات هو ببساطة خارج المخططات. من الواضح أن هذه فترة من الضجيج المجنون. الحمد لله، ساعدت تقنية blockchain على تهدئة هذا الضجيج قليلاً. يتم اختيار المتخصصين في Blockchain بشكل أسرع.

لكن العديد من الشركات تعتقد الآن أنها إذا استثمرت في التعلم الآلي، فإن حدائقها سوف تزدهر على الفور. هذا خطأ. يجب أن يحل التعلم الآلي مشكلات محددة، وليس وجودها فقط.

هناك أوقات يرغب فيها البنك في إنشاء نظام توصية للخدمات المقدمة للمستخدمين. ونحن نسأل: هل تعتقدون أن هذا سيكون له ما يبرره اقتصاديا؟ يجيبون: “لا نهتم. افعلها. كل شخص لديه أنظمة توصية، وسنكون في الاتجاه الصحيح.

الألم هو أن شيئًا مفيدًا حقًا للأعمال لا يمكن إنجازه في يوم واحد. نحن بحاجة إلى مشاهدة كيف سيتعلم النظام. ولكنها ترتكب الأخطاء دائمًا في البداية، وقد تنقصها بعض البيانات أثناء التدريب. تقوم بتصحيح الأخطاء، ثم تصحيحها مرة أخرى، وحتى إعادة كل شيء. بعد ذلك، تحتاج إلى تكوين النظام بحيث يعمل في الإنتاج، بحيث يكون مستقرًا وقابلاً للتطوير، ولا يزال هذا هو الوقت المناسب. ونتيجة لذلك، يستغرق المشروع الواحد ستة أشهر أو سنة أو أكثر.


إذا نظرت إلى أساليب التعلم الآلي باعتبارها صندوقًا أسود، فمن الممكن أن تفوتك بسهولة عندما تبدأ بعض الأشياء المجنونة في الحدوث. هناك قصة ملتحية. وطلب الجيش تطوير خوارزمية يمكن استخدامها لتحليل ما إذا كانت هناك دبابة في الصورة أم لا. لقد صنعه الباحثون، واختبروه، والجودة ممتازة، وكل شيء على ما يرام، وأعطوه للجيش. يأتي الجيش ويقول لا شيء يعمل. بدأ العلماء في الفهم بعصبية. اتضح أنه في جميع الصور مع الدبابة التي أحضرها الجيش، تم وضع علامة في الزاوية بقلم. تعلمت الخوارزمية العثور على علامة اختيار دون أي عيب؛ ولم تكن تعرف شيئًا عن الدبابة. وبطبيعة الحال، لم تكن هناك علامات اختيار على الصور الجديدة.

لقد التقيت بأطفال يطورون أنظمة الحوار الخاصة بهم. هل فكرت يومًا أنك بحاجة إلى التعاون مع الأطفال؟

لقد كنت أذهب إلى جميع أنواع الأحداث لأطفال المدارس منذ بعض الوقت، وألقي محاضرات حول التعلم الآلي. وبالمناسبة، قام طالب بالصف العاشر بتدريس أحد المواضيع لي. كنت على يقين تام أن قصتي ستكون جيدة ومثيرة للاهتمام، وكنت فخورة بنفسي، وبدأت البث، وكانت الفتاة تقول: “أوه، نريد التقليل من هذا الشيء”. أنا أنظر وأفكر، حقًا، لماذا، ويمكن التقليل من الحقيقة، ولا يوجد شيء خاص لإثباته هنا. لقد مرت عدة سنوات، وهي الآن تستمع إلى محاضراتنا كطالبة في معهد الفيزياء والتكنولوجيا. بالمناسبة، لدى Yandex Yandex.Lyceum، حيث يمكن لأطفال المدارس الحصول على المعرفة الأساسية بالبرمجة مجانًا.

- التوصية بالجامعات والكليات التي يتم فيها تدريس التعلم الآلي حاليًا.

هناك MIPT وكليات FIVT وFUPM. يوجد في HSE أيضًا قسم رائع لعلوم الكمبيوتر، وفي جامعة موسكو الحكومية يوجد تعلم آلي في مجمع علوم الكمبيوتر. حسنًا، الآن يمكنك أن تأخذ دورتنا في جامعة RUDN.

كما قلت، هذه المهنة مطلوبة. لفترة طويلة جدًا، كان الأشخاص الذين تلقوا التعليم الفني يفعلون أشياء مختلفة تمامًا. يعد التعلم الآلي مثالًا رائعًا عندما تصبح كل الأشياء التي يدرسها الأشخاص الحاصلون على التعليم الفني مطلوبة بشكل مباشر ومفيدة ومدفوعة الأجر.

- كيف جيدة؟

قم بتسمية المبلغ.

- 500 ألف شهريا.

يمكنك ذلك دون أن تكون عالم بيانات عاديًا. لكن في بعض الشركات يمكن للمتدرب أن يكسب 50 ألفًا مقابل عمل بسيط، وهناك نطاق واسع جدًا. بشكل عام، يمكن مقارنة راتب عالم البيانات الرائع براتب الرئيس التنفيذي لشركة متوسطة الحجم. في العديد من الشركات، بالإضافة إلى الراتب، يتمتع الموظف بالعديد من المزايا الأخرى، وإذا كان من الواضح أن الشخص لم يأت لإضافة علامة تجارية جيدة إلى سيرته الذاتية، بل للعمل فعليًا، فكل شيء سيكون على ما يرام بالنسبة له.