الاتصالات بين الخلايا العصبية في الشبكة العصبية. الشبكات العصبية المتكررة

25.04.2019

تعرفنا في هذا الفصل على مفاهيم مثل الذكاء الاصطناعي والتعلم الآلي والشبكات العصبية الاصطناعية.

في هذا الفصل سأصف بالتفصيل نموذج الخلايا العصبية الاصطناعية، وأتحدث عن أساليب تدريب الشبكة، كما سأصف بعض الأنواع المعروفة من الشبكات العصبية الاصطناعية التي سندرسها في الفصول التالية.

تبسيط

في الفصل الأخير، تحدثت باستمرار عن بعض التبسيطات الجادة. والسبب في التبسيط هو أنه لا توجد أجهزة كمبيوتر حديثة قادرة على ذلك سريعمحاكاة الأنظمة المعقدة مثل دماغنا. بالإضافة إلى ذلك، كما قلت بالفعل، فإن دماغنا مليء بالآليات البيولوجية المختلفة التي لا تتعلق بمعالجة المعلومات.

نحن بحاجة إلى نموذج لتحويل إشارة الدخل إلى إشارة الخرج التي نحتاجها. كل شيء آخر لا يزعجنا. لنبدأ بالتبسيط.

التركيب البيولوجي → الرسم التخطيطي

في الفصل السابق، أدركت مدى تعقيد الشبكات العصبية البيولوجية والخلايا العصبية البيولوجية. بدلاً من رسم الخلايا العصبية كوحوش ذات مجسات، دعونا نرسم المخططات فقط.

بشكل عام، هناك عدة طرق لتمثيل الشبكات العصبية والخلايا العصبية بيانياً. هنا سوف نصور الخلايا العصبية الاصطناعية على شكل دوائر.

بدلا من التشابك المعقد للمدخلات والمخرجات، سوف نستخدم الأسهم التي تشير إلى اتجاه حركة الإشارة.

وهكذا، يمكن تمثيل الشبكة العصبية الاصطناعية على أنها مجموعة من الدوائر (الخلايا العصبية الاصطناعية) متصلة بواسطة الأسهم.

الإشارات الكهربائية → الأرقام

في الشبكة العصبية البيولوجية الحقيقية، يتم إرسال إشارة كهربائية من مدخلات الشبكة إلى مخرجاتها. قد يتغير أثناء مروره عبر الشبكة العصبية.

ستكون الإشارة الكهربائية دائمًا إشارة كهربائية. من الناحية المفاهيمية، لا شيء يتغير. ولكن ماذا يتغير بعد ذلك؟ يتغير حجم هذه الإشارة الكهربائية (أقوى / أضعف). ويمكن دائمًا التعبير عن أي قيمة كرقم (أكثر/أقل).

في نموذج شبكتنا العصبية الاصطناعية، لا نحتاج إلى تنفيذ سلوك الإشارة الكهربائية على الإطلاق، حيث لن يعتمد أي شيء على تنفيذها على أي حال.

سوف نقوم بتزويد مدخلات الشبكة ببعض الأرقام التي ترمز إلى حجم الإشارة الكهربائية إن وجدت. سوف تتحرك هذه الأرقام عبر الشبكة وتتغير بطريقة ما. عند إخراج الشبكة سوف نتلقى بعض الأرقام الناتجة، وهي استجابة الشبكة.

للراحة، سنواصل الاتصال بأرقامنا المتداولة في إشارات الشبكة.

المشابك العصبية → أوزان الاتصال

لنتذكر الصورة من الفصل الأول، والتي تم فيها تصوير الروابط بين الخلايا العصبية - المشابك العصبية - بالألوان. يمكن للمشابك العصبية أن تقوي أو تضعف الإشارة الكهربائية التي تمر عبرها.

دعونا نميز كل اتصال من هذا القبيل برقم معين يسمى وزن هذا الاتصال. يتم ضرب الإشارة التي تمر عبر اتصال معين بوزن الاتصال المقابل.

وهذه نقطة أساسية في مفهوم الشبكات العصبية الاصطناعية، وسأشرحها بمزيد من التفصيل. ننظر إلى الصورة أدناه. الآن كل سهم أسود (اتصال) في هذه الصورة يتوافق مع رقم معين ​\(w_i \) ​ (وزن الاتصال). وعندما تمر الإشارة من خلال هذا الاتصال، فإن حجمها مضروب في وزن هذا الاتصال.

في الشكل أعلاه، ليس لكل اتصال وزن لأنه ببساطة لا توجد مساحة للتسميات. في الواقع، كل اتصال \(i \) ​له وزنه ​\(w_i \) ​الخاص به.

الخلايا العصبية الاصطناعية

ننتقل الآن إلى النظر في البنية الداخلية للخلية العصبية الاصطناعية وكيفية تحويل الإشارة التي تصل إلى مدخلاتها.

يوضح الشكل أدناه نموذجًا كاملاً للخلية العصبية الاصطناعية.

لا تنزعج، لا يوجد شيء معقد هنا. دعونا ننظر إلى كل شيء بالتفصيل من اليسار إلى اليمين.

المدخلات والأوزان والأفعى

يجب أن تحتوي كل خلية عصبية، بما في ذلك الخلايا العصبية الاصطناعية، على بعض المدخلات التي تتلقى من خلالها الإشارة. لقد قدمنا ​​بالفعل مفهوم الأوزان التي يتم من خلالها مضاعفة الإشارات التي تمر عبر الاتصال. في الصورة أعلاه، تظهر الأوزان على شكل دوائر.

يتم ضرب الإشارات الواردة عند المدخلات بأوزانها. يتم ضرب إشارة الإدخال الأول ​\(x_1 \) ​ بالوزن ​\(w_1 \) ​الموافق لهذا الإدخال. ونتيجة لذلك نحصل على ​\(x_1w_1 \) ​. وهكذا حتى الإدخال ​\(n\)​. نتيجة لذلك، عند الإدخال الأخير نحصل على ​\(x_nw_n \)​.

الآن يتم نقل جميع المنتجات إلى الأفعى. فقط بناءً على اسمه، يمكنك فهم ما يفعله. فهو ببساطة يجمع جميع إشارات الإدخال مضروبة في الأوزان المقابلة:

\[ x_1w_1+x_2w_2+\cdots+x_nw_n = \sum\limits^n_(i=1)x_iw_i \]

مساعدة رياضية

سيجما - ويكيبيديا

عندما يكون من الضروري كتابة تعبير كبير بإيجاز يتكون من مجموع المصطلحات المتكررة/من نفس النوع، يتم استخدام علامة سيجما.

لنفكر في أبسط خيار للتسجيل:

\[ \sum\limits^5_(i=1)i=1+2+3+4+5 \]

وبالتالي، من أسفل سيجما نقوم بتعيين متغير العداد ​\(i \)​ قيمة بداية، والتي ستزداد حتى تصل إلى الحد الأعلى (في المثال أعلاه هو 5).

يمكن أن يكون الحد الأعلى متغيرًا أيضًا. اسمحوا لي أن أعطيكم مثالا على مثل هذه الحالة.

دعونا نحصل على متاجر ​\(n \). كل متجر له رقمه الخاص: من 1 إلى ​\(n\)​. كل متجر يحقق ربحا. لنأخذ بعضًا (مهما كان) ​\(i \) ​المتجر. الربح منه يساوي ​\(p_i \) ​.

\[ P = p_1+p_2+\cdots+p_i+\cdots+p_n \]

كما ترون، جميع شروط هذا المبلغ هي من نفس النوع. ثم يمكن كتابتها بإيجاز على النحو التالي:

\[ P=\sum\limits^n_(i=1)p_i \]

بالكلمات: “لخص أرباح جميع المتاجر، بدءًا من الأول وانتهاءً بـ \(ن\) ​-ث”. في شكل صيغة، فهي أبسط بكثير وأكثر ملاءمة وأكثر جمالا.

نتيجة الجمع هي رقم يسمى المبلغ المرجح.

مبلغ مرجح(مبلغ مرجح) (​\(net \) ​) - مجموع إشارات الإدخال مضروبًا في أوزانها المقابلة.

\[ صافي=\sum\limits^n_(i=1)x_iw_i \]

دور الأفعى واضح - فهو يجمع كل إشارات الإدخال (التي يمكن أن يكون هناك الكثير منها) في رقم واحد - وهو مجموع مرجح يميز الإشارة التي تستقبلها الخلية العصبية ككل. يمكن تمثيل مجموع مرجح آخر على أنه درجة الإثارة العامة للخلية العصبية.

مثال

لفهم دور المكون الأخير للخلية العصبية الاصطناعية - وظيفة التنشيط - سأقدم تشبيهًا.

دعونا نلقي نظرة على خلية عصبية اصطناعية واحدة. مهمته هي أن يقرر ما إذا كان سيذهب في إجازة إلى البحر. للقيام بذلك، نقوم بتوفير بيانات مختلفة لمدخلاتها. دع الخلايا العصبية لدينا تحتوي على 4 مدخلات:

  1. تكلفة السفر
  2. كيف هو الطقس في البحر؟
  3. وضع العمل الحالي
  4. هل سيكون هناك مطعم للوجبات الخفيفة على الشاطئ

سنقوم بتمييز كل هذه المعلمات على أنها 0 أو 1. وبناءً على ذلك، إذا كان الطقس في البحر جيدًا، فإننا نطبق 1 على هذا الإدخال، وهكذا مع جميع المعلمات الأخرى.

إذا كان للخلية العصبية أربعة مدخلات، فيجب أن يكون هناك أربعة أوزان. في مثالنا، يمكن اعتبار معاملات الترجيح بمثابة مؤشرات لأهمية كل مدخل، مما يؤثر على القرار العام للخلية العصبية. نقوم بتوزيع أوزان المدخلات على النحو التالي:

من السهل أن نرى أن عوامل التكلفة والطقس في البحر (أول مدخلين) تلعب دورًا مهمًا للغاية. وسوف يلعبون أيضًا دورًا حاسمًا عندما تتخذ الخلية العصبية قرارًا.

دعونا نقدم الإشارات التالية لمدخلات الخلايا العصبية لدينا:

نضرب أوزان المدخلات بإشارات المدخلات المقابلة:

المبلغ المرجح لمثل هذه المجموعة من إشارات الإدخال هو 6:

\[ net=\sum\limits^4_(i=1)x_iw_i = 5 + 0 + 0 + 1 =6 \]

وهنا يأتي دور وظيفة التنشيط.

وظيفة التنشيط

من غير المجدي تقديم مبلغ مرجح كمخرجات. يجب على الخلية العصبية معالجتها بطريقة أو بأخرى وتوليد إشارة خرج مناسبة. لهذه الأغراض يتم استخدام وظيفة التنشيط.

يقوم بتحويل المجموع الموزون إلى رقم معين، وهو ناتج الخلية العصبية (نشير إلى ناتج الخلية العصبية بالمتغير ​\(out \) ​).

تستخدم أنواع مختلفة من الخلايا العصبية الاصطناعية مجموعة متنوعة من وظائف التنشيط. بشكل عام، يتم الإشارة إليها بالرمز ​\(\phi(net) \) ​. تحديد الإشارة الموزونة بين قوسين يعني أن وظيفة التنشيط تأخذ المبلغ الموزون كمعلمة.

وظيفة التنشيط (وظيفة التنشيط)(​\(\phi(net) \) ​) هي دالة تأخذ مجموعًا مرجحًا كوسيطة. قيمة هذه الوظيفة هي مخرجات الخلية العصبية (​\(out \) ​).

وظيفة القفزة الواحدة

أبسط نوع من وظيفة التنشيط. يمكن أن يساوي ناتج الخلية العصبية 0 أو 1 فقط. إذا كان المجموع المرجح أكبر من عتبة معينة ​\(b\)​، فإن ناتج الخلية العصبية يساوي 1. وإذا كان أقل، فسيكون 0.

كيف يمكن أن تستخدم؟ لنفترض أننا نذهب إلى البحر فقط عندما يكون المجموع المرجح أكبر من أو يساوي 5. وهذا يعني أن عتبة لدينا هي 5:

في مثالنا، كان المجموع المرجح 6، مما يعني أن إشارة الخرج للخلية العصبية لدينا هي 1. لذا، نحن ذاهبون إلى البحر.

ومع ذلك، إذا كان الطقس في البحر سيئًا وكانت الرحلة باهظة الثمن، ولكن كان هناك مطعم للوجبات الخفيفة وكانت بيئة العمل طبيعية (المدخلات: 0011)، فإن المجموع المرجح يساوي 2، وهو ما يعني ناتج ستكون قيمة الخلية العصبية 0. لذا، لن نذهب إلى أي مكان.

في الأساس، تنظر الخلية العصبية إلى مجموع مرجح وإذا كان أكبر من عتبته، فإن الخلية العصبية تنتج ناتجًا يساوي 1.

بيانيا، يمكن تصوير وظيفة التنشيط هذه على النحو التالي.

يحتوي المحور الأفقي على قيم المجموع المرجح. على المحور الرأسي توجد قيم إشارة الخرج. كما هو واضح، هناك قيمتان فقط لإشارة الخرج ممكنة: 0 أو 1. علاوة على ذلك، سيتم إخراج 0 دائمًا من ناقص اللانهاية حتى قيمة معينة للمجموع المرجح، تسمى العتبة. إذا كان المبلغ المرجح يساوي أو أكبر من العتبة، فإن الدالة ترجع 1. كل شيء بسيط للغاية.

الآن دعونا نكتب دالة التنشيط هذه رياضيا. من المؤكد أنك صادفت مفهوم الوظيفة المركبة. وذلك عندما نجمع عدة قواعد تحت دالة واحدة يتم من خلالها حساب قيمتها. في شكل دالة مركبة، ستبدو دالة القفز المفردة كما يلي:

\[ خارج (صافي) = \ بداية (الحالات) 0، صافي< b \\ 1, net \geq b \end{cases} \]

لا يوجد شيء معقد في هذا التسجيل. يعتمد إخراج الخلية العصبية (​\(out \) ​) على المجموع المرجح (​\(net \)​) على النحو التالي: إذا كان ​\(net \) ​ (المجموع الموزون) أقل من بعض العتبات (​ \(b \ ) ​)، فإن ​\(out \) ​ (إخراج العصبون) يساوي 0. وإذا كان ​\(net \) ​ أكبر من أو يساوي العتبة ​\(b \) ​، إذن ​\(out \) ​ يساوي 1 .

وظيفة السيني

في الواقع، هناك عائلة كاملة من الوظائف السيني، بعضها يستخدم كوظائف تنشيط في الخلايا العصبية الاصطناعية.

كل هذه الوظائف لها بعض الخصائص المفيدة جدًا، والتي يتم استخدامها في الشبكات العصبية. ستصبح هذه الخصائص واضحة بمجرد رؤية الرسوم البيانية لهذه الوظائف.

لذا... فإن السيني الأكثر استخدامًا في الشبكات العصبية هو وظيفة لوجستية.

يبدو الرسم البياني لهذه الوظيفة بسيطًا جدًا. إذا نظرت عن كثب، يمكنك رؤية بعض التشابه مع الحرف الإنجليزي ​\(S \) ​، ومن هنا يأتي اسم عائلة هذه الوظائف.

وهذه هي الطريقة التي يتم كتابتها تحليليا:

\[ خارج(net)=\frac(1)(1+\exp(-a \cdot net)) \]

ما هي المعلمة ​\(أ \) ​؟ هذا هو الرقم الذي يميز درجة انحدار الوظيفة. فيما يلي وظائف لوجستية بمعلمات مختلفة ​\(a \) ​.

دعونا نتذكر الخلايا العصبية الاصطناعية لدينا، والتي تحدد ما إذا كان من الضروري الذهاب إلى البحر. في حالة وظيفة القفزة الواحدة، كان كل شيء واضحًا. إما أن نذهب إلى البحر (1) أو لا (0).

وهنا القضية أقرب إلى الواقع. لسنا متأكدين تمامًا (خاصة إذا كنت مصابًا بجنون العظمة) - هل يستحق الأمر الذهاب؟ بعد ذلك، سيؤدي استخدام الدالة اللوجستية كدالة تنشيط إلى الحصول على رقم بين 0 و1. علاوة على ذلك، كلما زاد المبلغ المرجح، كلما كان الناتج أقرب إلى 1 (لكنه لن يساويه تمامًا). على العكس من ذلك، كلما كان المبلغ المرجح أصغر، كلما اقترب ناتج الخلية العصبية من 0.

على سبيل المثال، ناتج الخلية العصبية لدينا هو 0.8. وهذا يعني أنه يعتقد أن الذهاب إلى البحر لا يزال يستحق العناء. إذا كان ناتجه يساوي 0.2، فهذا يعني أنه يكاد يكون من المؤكد أنه ضد الذهاب إلى البحر.

ما هي الخصائص الرائعة التي تمتلكها الوظيفة اللوجستية؟

  • إنها دالة "ضاغطة"، أي أنه بغض النظر عن الوسيط (المجموع الموزون)، فإن إشارة الخرج ستكون دائمًا في النطاق من 0 إلى 1
  • إنها أكثر مرونة من دالة القفز المفردة - لا يمكن أن تكون نتيجتها 0 و1 فحسب، بل أي رقم بينهما
  • في جميع النقاط له مشتق، ويمكن التعبير عن هذا المشتق من خلال نفس الوظيفة

وبسبب هذه الخصائص، تُستخدم الوظيفة اللوجستية في أغلب الأحيان كوظيفة تنشيط في الخلايا العصبية الاصطناعية.

الظل الزائدي

ومع ذلك، هناك سيني آخر - الظل الزائدي. يتم استخدامه كوظيفة تنشيط من قبل علماء الأحياء لإنشاء نموذج أكثر واقعية للخلية العصبية.

تتيح لك هذه الوظيفة الحصول على قيم الإخراج لعلامات مختلفة (على سبيل المثال، من -1 إلى 1)، والتي يمكن أن تكون مفيدة لعدد من الشبكات.

يتم كتابة الدالة على النحو التالي:

\[ خارج(net) = \tanh\left(\frac(net)(a)\right) \]

في الصيغة أعلاه، تحدد المعلمة ​\(a \)​ أيضًا درجة انحدار الرسم البياني لهذه الوظيفة.

وهذا ما يبدو عليه الرسم البياني لهذه الدالة.

كما ترون، يبدو وكأنه رسم بياني لوظيفة لوجستية. يحتوي الظل الزائدي على جميع الخصائص المفيدة التي تتمتع بها الوظيفة اللوجستية.

ماذا تعلمنا؟

الآن لديك فهم كامل للبنية الداخلية للخلية العصبية الاصطناعية. سأقدم مرة أخرى وصفا موجزا لعمله.

الخلايا العصبية لديها مدخلات. يتلقون إشارات على شكل أرقام. كل إدخال له وزنه الخاص (رقم أيضًا). يتم ضرب إشارات الإدخال بالأوزان المقابلة. نحصل على مجموعة من إشارات الإدخال "المرجحة".

ثم يتم تحويل المبلغ المرجح وظيفة التنشيطونحصل مخرجات الخلايا العصبية.

دعونا الآن نصيغ أقصر وصف لعمل الخلية العصبية – نموذجها الرياضي:

النموذج الرياضي للخلية العصبية الاصطناعيةمع المدخلات ​\(n \) ​:

أين
​\(\phi \) ​ – وظيفة التنشيط
\(\مجموع\حدود^n_(i=1)x_iw_i \)​ - المجموع المرجح، كمجموع ​\(n\)​ منتجات إشارات الدخل بالأوزان المقابلة.

أنواع الشبكات العصبية الاصطناعية

لقد اكتشفنا بنية الخلية العصبية الاصطناعية. تتكون الشبكات العصبية الاصطناعية من مجموعة من الخلايا العصبية الاصطناعية. يطرح سؤال منطقي - كيفية وضع/ربط هذه الخلايا العصبية الاصطناعية نفسها ببعضها البعض؟

كقاعدة عامة، تحتوي معظم الشبكات العصبية على ما يسمى طبقة الإدخالوالتي تؤدي مهمة واحدة فقط - توزيع إشارات الإدخال على الخلايا العصبية الأخرى. الخلايا العصبية في هذه الطبقة لا تقوم بأي حسابات.

الشبكات العصبية أحادية الطبقة

في الشبكات العصبية أحادية الطبقة، يتم تغذية الإشارات من طبقة الإدخال مباشرة إلى طبقة الإخراج. يقوم بإجراء الحسابات اللازمة، ويتم إرسال نتائجها على الفور إلى المخرجات.

تبدو الشبكة العصبية أحادية الطبقة كما يلي:

في هذه الصورة، يتم الإشارة إلى طبقة الإدخال بالدوائر (لا تعتبر طبقة شبكة عصبية)، وعلى اليمين توجد طبقة من الخلايا العصبية العادية.

ترتبط الخلايا العصبية ببعضها البعض عن طريق الأسهم. يوجد فوق الأسهم أوزان الوصلات المقابلة (معاملات الترجيح).

شبكة عصبية أحادية الطبقة (شبكة عصبية أحادية الطبقة) - شبكة يتم فيها تغذية الإشارات من طبقة الإدخال على الفور إلى طبقة الإخراج، والتي تقوم بتحويل الإشارة وتنتج استجابة على الفور.

الشبكات العصبية متعددة الطبقات

تتميز هذه الشبكات، بالإضافة إلى طبقات الإدخال والإخراج للخلايا العصبية، أيضًا بطبقة (طبقات) مخفية. من السهل فهم موقعها - تقع هذه الطبقات بين طبقات الإدخال والإخراج.

هذا الهيكل من الشبكات العصبية ينسخ البنية متعددة الطبقات لأجزاء معينة من الدماغ.

ليس من قبيل المصادفة أن الطبقة المخفية حصلت على اسمها. والحقيقة هي أنه تم تطوير طرق تدريب الخلايا العصبية ذات الطبقة المخفية مؤخرًا نسبيًا فقط. قبل ذلك، تم استخدام الشبكات العصبية أحادية الطبقة فقط.

تتمتع الشبكات العصبية متعددة الطبقات بقدرات أكبر بكثير من الشبكات العصبية ذات الطبقة الواحدة.

يمكن مقارنة عمل الطبقات المخفية من الخلايا العصبية بعمل مصنع كبير. يتم تجميع المنتج (إشارة الخرج) في المصنع على مراحل. بعد كل آلة يتم الحصول على بعض النتائج المتوسطة. تعمل الطبقات المخفية أيضًا على تحويل إشارات الإدخال إلى بعض النتائج الوسيطة.

شبكة عصبية متعددة الطبقات (شبكة عصبية متعددة الطبقات) - شبكة عصبية تتكون من مدخلات ومخرجات وطبقة واحدة (عدة) مخفية من الخلايا العصبية تقع بينهما.

شبكات التوزيع المباشر

يمكنك ملاحظة أحد التفاصيل المثيرة للاهتمام في صور الشبكات العصبية في الأمثلة أعلاه.

في جميع الأمثلة، تنتقل الأسهم بشكل صارم من اليسار إلى اليمين، أي أن الإشارة في مثل هذه الشبكات تنتقل بدقة من طبقة الإدخال إلى طبقة الإخراج.

شبكات التوزيع المباشر (الشبكة العصبية المغذية) (شبكات التغذية الأمامية) - شبكات عصبية اصطناعية تنتشر فيها الإشارة بشكل صارم من طبقة الإدخال إلى طبقة الإخراج. لا تنتشر الإشارة في الاتجاه المعاكس.

تُستخدم هذه الشبكات على نطاق واسع وتحل بنجاح فئة معينة من المشكلات: التنبؤ والتجميع والاعتراف.

ومع ذلك، لا أحد يمنع الإشارة من الذهاب في الاتجاه المعاكس.

شبكات ردود الفعل

في الشبكات من هذا النوع، يمكن للإشارة أيضًا أن تسير في الاتجاه المعاكس. ما هي الميزة؟

والحقيقة هي أنه في شبكات التغذية الأمامية، يتم تحديد إخراج الشبكة من خلال إشارة الإدخال ومعاملات الترجيح للخلايا العصبية الاصطناعية.

وفي الشبكات ذات التغذية الراجعة، يمكن أن تعود مخرجات الخلايا العصبية إلى المدخلات. وهذا يعني أن مخرجات الخلية العصبية لا يتم تحديدها فقط من خلال أوزانها وإشارات الدخل الخاصة بها، ولكن أيضًا من خلال المخرجات السابقة (بما أنها عادت إلى المدخلات مرة أخرى).

إن قدرة الإشارات على الانتشار في الشبكة تفتح إمكانيات جديدة ومذهلة للشبكات العصبية. باستخدام هذه الشبكات، يمكنك إنشاء شبكات عصبية تعمل على استعادة الإشارات أو استكمالها. بمعنى آخر، تتمتع هذه الشبكات العصبية بخصائص الذاكرة قصيرة المدى (مثل ذاكرة الشخص).

شبكات ردود الفعل (الشبكة العصبية المتكررة) - شبكات عصبية اصطناعية يمكن من خلالها تغذية مخرجات الخلية العصبية إلى مدخلاتها. وبشكل أعم، يعني هذا القدرة على نشر الإشارة من المخرجات إلى المدخلات.

تدريب الشبكات العصبية

الآن دعونا نلقي نظرة على مسألة تدريب الشبكة العصبية بمزيد من التفصيل. ما هو؟ وكيف يحدث هذا؟

ما هو التدريب الشبكي؟

الشبكة العصبية الاصطناعية هي عبارة عن مجموعة من الخلايا العصبية الاصطناعية. الآن لنأخذ، على سبيل المثال، 100 خلية عصبية ونربطها ببعضها البعض. من الواضح أننا عندما نطبق إشارة على الإدخال، سنحصل على شيء لا معنى له عند الإخراج.

وهذا يعني أننا بحاجة إلى تغيير بعض معلمات الشبكة حتى يتم تحويل إشارة الإدخال إلى الإخراج الذي نحتاجه.

ما الذي يمكننا تغييره في الشبكة العصبية؟

إن تغيير العدد الإجمالي للخلايا العصبية الاصطناعية ليس له أي معنى لسببين. أولاً، زيادة عدد عناصر الحوسبة ككل يجعل النظام أثقل وأكثر تكرارًا. ثانيًا، إذا قمت بجمع 1000 أحمق بدلاً من 100، فلن يتمكنوا من الإجابة على السؤال بشكل صحيح.

لا يمكن تغيير المُضيف، لأنه يؤدي وظيفة واحدة محددة بدقة - الإضافة. إذا استبدلناها بشيء ما أو قمنا بإزالتها تمامًا، فلن تكون خلية عصبية صناعية على الإطلاق.

إذا قمنا بتغيير وظيفة التنشيط لكل خلية عصبية، فسنحصل على شبكة عصبية غير متجانسة للغاية ولا يمكن السيطرة عليها. بالإضافة إلى ذلك، في معظم الحالات، تكون الخلايا العصبية في الشبكات العصبية من نفس النوع. أي أنهم جميعًا لديهم نفس وظيفة التنشيط.

لم يتبق سوى خيار واحد - تغيير أوزان الاتصال.

تدريب الشبكات العصبية (تمرين)- ابحث عن مجموعة معاملات الترجيح التي يتم من خلالها تحويل إشارة الإدخال بعد المرور عبر الشبكة إلى الإخراج الذي نحتاجه.

هذا النهج لمصطلح "تدريب الشبكة العصبية" يتوافق أيضًا مع الشبكات العصبية البيولوجية. يتكون دماغنا من عدد كبير من الشبكات العصبية المتصلة ببعضها البعض. يتكون كل واحد منهم على حدة من خلايا عصبية من نفس النوع (وظيفة التنشيط هي نفسها). نتعلم من خلال تغيير نقاط الاشتباك العصبي - العناصر التي تقوي / تضعف إشارة الإدخال.

ومع ذلك، هناك نقطة واحدة أكثر أهمية. إذا قمت بتدريب شبكة باستخدام إشارة إدخال واحدة فقط، فستتذكر الشبكة ببساطة الإجابة الصحيحة. من الخارج يبدو أنها "تعلمت" بسرعة كبيرة. وبمجرد إعطاء إشارة معدلة قليلاً، متوقعًا رؤية الإجابة الصحيحة، ستنتج الشبكة هراء.

في الواقع، لماذا نحتاج إلى شبكة تكتشف الوجه في صورة واحدة فقط؟ ونتوقع أن تكون الشبكة قادرة تعميمبعض العلامات والتعرف على الوجوه في صور أخرى أيضًا.

ولهذا الغرض تم إنشاؤها عينات التدريب.

عدة التدريبات (عدة التدريبات) عبارة عن مجموعة محدودة من إشارات الإدخال (أحيانًا مع إشارات الإخراج الصحيحة) التي يتم تدريب الشبكة منها.

بعد تدريب الشبكة، أي عندما تنتج الشبكة نتائج صحيحة لجميع إشارات الإدخال من مجموعة التدريب، يمكن استخدامها عمليًا.

ومع ذلك، قبل إطلاق شبكة عصبية طازجة في المعركة، غالبًا ما يتم تقييم جودة عملها على ما يسمى عينة الاختبار.

عينة الاختبار (مجموعة الاختبار) - مجموعة محدودة من إشارات الإدخال (أحيانًا مع إشارات الإخراج الصحيحة) التي يتم من خلالها تقييم جودة تشغيل الشبكة.

لقد فهمنا ما هو "التدريب الشبكي" - اختيار مجموعة الأوزان المناسبة. الآن يطرح السؤال - كيف يمكنك تدريب الشبكة؟ في الحالة الأكثر عمومية، هناك طريقتان تؤديان إلى نتائج مختلفة: التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف.

التدريب المدروس

جوهر هذا النهج هو أنك تقدم إشارة كمدخل، وتنظر إلى استجابة الشبكة، ثم تقارنها بالاستجابة الصحيحة الجاهزة.

نقطة مهمة. لا تخلط بين الإجابات الصحيحة وخوارزمية الحل المعروفة! يمكنك تتبع الوجه في الصورة بإصبعك (الإجابة الصحيحة)، لكن لن تتمكن من معرفة كيف فعلت ذلك (خوارزمية معروفة). الوضع هو نفسه هنا.

بعد ذلك، باستخدام خوارزميات خاصة، يمكنك تغيير أوزان اتصالات الشبكة العصبية وإعطائها إشارة إدخال مرة أخرى. تقارن إجابتها بالإجابة الصحيحة وتكرر هذه العملية حتى تبدأ الشبكة في الاستجابة بدقة مقبولة (كما قلت في الفصل الأول، لا يمكن للشبكة أن تعطي إجابات دقيقة بشكل لا لبس فيه).

التدريب المدروس (التعلم تحت الإشراف) هو نوع من التدريب الشبكي يتم فيه تغيير أوزانها بحيث تختلف إجابات الشبكة إلى الحد الأدنى عن الإجابات الصحيحة المعدة مسبقًا.

أين يمكنني الحصول على الإجابات الصحيحة؟

إذا أردنا أن تتعرف الشبكة على الوجوه، فيمكننا إنشاء مجموعة تدريب مكونة من 1000 صورة (إشارات الإدخال) واختيار الوجوه منها بشكل مستقل (الإجابات الصحيحة).

إذا أردنا أن تتنبأ الشبكة بزيادة/انخفاض الأسعار، فيجب إجراء عينة التدريب بناءً على البيانات السابقة. كإشارات إدخال، يمكنك أخذ أيام معينة، والحالة العامة للسوق وغيرها من المعالم. والإجابات الصحيحة هي ارتفاع الأسعار وانخفاضها في تلك الأيام.

تجدر الإشارة إلى أن المعلم، بالطبع، ليس بالضرورة شخصا. والحقيقة هي أنه في بعض الأحيان يجب تدريب الشبكة لساعات وأيام، مما يؤدي إلى آلاف وعشرات الآلاف من المحاولات. في 99٪ من الحالات، يتم تنفيذ هذا الدور بواسطة جهاز كمبيوتر، أو بالأحرى، برنامج كمبيوتر خاص.

تعليم غير مشرف عليه

يتم استخدام التعلم غير الخاضع للرقابة عندما لا يكون لدينا الإجابات الصحيحة لإشارات الإدخال. في هذه الحالة، تتكون مجموعة التدريب بأكملها من مجموعة من إشارات الإدخال.

ماذا يحدث عندما يتم تدريب الشبكة بهذه الطريقة؟ اتضح أنه مع هذا "التدريب" تبدأ الشبكة في التمييز بين فئات الإشارات المقدمة للمدخلات. باختصار، تبدأ الشبكة في التجمع.

على سبيل المثال، تقوم بعرض الحلوى والمعجنات والكعك على الشبكة. لا يمكنك تنظيم تشغيل الشبكة بأي شكل من الأشكال. يمكنك ببساطة تغذية البيانات حول هذا الكائن إلى مدخلاته. بمرور الوقت، ستبدأ الشبكة في إنتاج إشارات من ثلاثة أنواع مختلفة، تكون مسؤولة عن الكائنات عند الإدخال.

تعليم غير مشرف عليه (تعليم غير مشرف عليه) هو نوع من التدريب على الشبكة حيث تقوم الشبكة بتصنيف إشارات الإدخال بشكل مستقل. لا تظهر إشارات الإخراج الصحيحة (المرجعية).

الاستنتاجات

في هذا الفصل، تعلمت كل شيء عن بنية الخلية العصبية الاصطناعية، بالإضافة إلى فهم شامل لكيفية عملها (ونموذجها الرياضي).

علاوة على ذلك، أنت الآن تعرف أنواعًا مختلفة من الشبكات العصبية الاصطناعية: الشبكات أحادية الطبقة، والمتعددة الطبقات، والشبكات المغذية، والشبكات المرتدة.

لقد تعلمت أيضًا عن التعلم الشبكي الخاضع للإشراف وغير الخاضع للإشراف.

أنت تعرف بالفعل النظرية اللازمة. تتضمن الفصول اللاحقة النظر في أنواع محددة من الشبكات العصبية، وخوارزميات محددة لتدريبها، وممارسة البرمجة.

الأسئلة والمهام

يجب أن تعرف المواد الواردة في هذا الفصل جيدًا، حيث أنها تحتوي على معلومات نظرية أساسية حول الشبكات العصبية الاصطناعية. تأكد من حصولك على إجابات موثوقة وصحيحة لجميع الأسئلة والمهام أدناه.

وصف تبسيط الشبكات العصبية الاصطناعية مقارنة بالشبكات العصبية البيولوجية.

1. تم تبسيط البنية المعقدة والمعقدة للشبكات العصبية البيولوجية وتمثيلها في شكل رسوم بيانية. لم يتبق سوى نموذج معالجة الإشارة.

2. طبيعة الإشارات الكهربائية في الشبكات العصبية هي نفسها. والفرق الوحيد هو حجمها. نقوم بإزالة الإشارات الكهربائية، ونستخدم بدلاً من ذلك أرقامًا تشير إلى حجم الإشارة المرسلة.

غالبًا ما يُشار إلى وظيفة التنشيط بالرمز ​\(\phi(net) \) ​.

اكتب نموذجًا رياضيًا للخلية العصبية الاصطناعية.

تقوم خلية عصبية اصطناعية ذات مدخلات ​\(n \) ​ بتحويل إشارة الدخل (الرقم) إلى إشارة الخرج (الرقم) على النحو التالي:

\[ خارج=\phi\left(\sum\limits^n_(i=1)x_iw_i\right) \]

ما الفرق بين الشبكات العصبية أحادية الطبقة ومتعددة الطبقات؟

تتكون الشبكات العصبية أحادية الطبقة من طبقة حسابية واحدة من الخلايا العصبية. ترسل طبقة الإدخال إشارات مباشرة إلى طبقة الإخراج، والتي تقوم بتحويل الإشارة وتنتج النتيجة على الفور.

تحتوي الشبكات العصبية متعددة الطبقات، بالإضافة إلى طبقات الإدخال والإخراج، على طبقات مخفية أيضًا. وتقوم هذه الطبقات المخفية ببعض التحولات الوسيطة الداخلية، على غرار مراحل إنتاج المنتجات في المصنع.

ما الفرق بين شبكات التغذية المرتدة وشبكات التغذية الراجعة؟

تسمح شبكات التغذية الأمامية للإشارة بالمرور في اتجاه واحد فقط - من المدخلات إلى المخرجات. لا تحتوي الشبكات ذات التغذية الراجعة على هذه القيود، ويمكن تغذية مخرجات الخلايا العصبية مرة أخرى إلى المدخلات.

ما هي مجموعة التدريب؟ ما هو معناها؟

قبل استخدام الشبكة عمليًا (على سبيل المثال، لحل المشكلات الحالية التي ليس لديك إجابات عنها)، تحتاج إلى جمع مجموعة من المشكلات بإجابات جاهزة لتدريب الشبكة عليها. هذه المجموعة تسمى مجموعة التدريب.

إذا قمت بجمع مجموعة صغيرة جدًا من إشارات الإدخال والإخراج، فستتذكر الشبكة الإجابات ببساطة ولن يتم تحقيق هدف التعلم.

ما المقصود بالتدريب الشبكي؟

التدريب الشبكي هو عملية تغيير معاملات ترجيح الخلايا العصبية الاصطناعية للشبكة من أجل اختيار مجموعة منها تحول إشارة الإدخال إلى الإخراج الصحيح.

ما هو التعلم الخاضع للإشراف وغير الخاضع للإشراف؟

عند تدريب الشبكة مع المعلم، يتم إعطاء إشارات لمدخلاتها، ومن ثم تتم مقارنة مخرجاتها مع المخرجات الصحيحة المعروفة مسبقًا. يتم تكرار هذه العملية حتى يتم تحقيق الدقة المطلوبة للإجابات.

إذا كانت الشبكات توفر إشارات الإدخال فقط، دون مقارنتها بالمخرجات الجاهزة، فستبدأ الشبكة في تصنيف إشارات الإدخال هذه بشكل مستقل. وبعبارة أخرى، فإنه ينفذ تجميع إشارات الإدخال. ويسمى هذا النوع من التعلم بالتعلم غير الخاضع للرقابة.

مجال آخر للبحث في الذكاء الاصطناعي هو الشبكات العصبية. لقد تم تصميمها لتشبه الشبكات العصبية الطبيعية للجهاز العصبي البشري.

الشبكات العصبية الاصطناعية

قام مخترع أول كمبيوتر عصبي، الدكتور روبرت هيشت نيلسن، بتعريف الشبكة العصبية على النحو التالي: “الشبكة العصبية هي نظام حاسوبي يتكون من عدد من عناصر المعالجة البسيطة والمترابطة للغاية والتي تعالج المعلومات من خلال استجابتها الديناميكية للمؤثرات الخارجية. تأثيرات."

البنية الأساسية للشبكات العصبية الاصطناعية (ANN)

تعتمد فكرة الشبكة العصبية الاصطناعية على الاعتقاد بأنه من الممكن تقليد عمل الدماغ البشري من خلال إنشاء الاتصالات الضرورية باستخدام السيليكون والأسلاك كما هو الحال في الخلايا العصبية الحية والتشعبات.

يتكون دماغ الإنسان من 100 مليار خلية عصبية تسمى الخلايا العصبية. وهي متصلة بآلاف الخلايا الأخرى عن طريق المحاور. يتم استقبال المحفزات من البيئة الخارجية أو الإشارات من الحواس عن طريق التشعبات. تقوم إشارات الإدخال هذه بإنشاء نبضات كهربائية تنتقل بسرعة عبر الشبكة العصبية. يمكن للخلية العصبية بعد ذلك إرسال رسائل إلى الخلايا العصبية الأخرى، والتي قد ترسل الرسالة إلى أبعد من ذلك أو قد لا ترسلها على الإطلاق.


تتكون الشبكات العصبية الاصطناعية من عدة عقد تحاكي الخلايا العصبية البيولوجية للدماغ البشري. ترتبط الخلايا العصبية وتتفاعل مع بعضها البعض. يمكن للعقد قبول بيانات الإدخال وإجراء عمليات بسيطة على البيانات. ونتيجة لهذه العمليات، يتم نقل البيانات إلى الخلايا العصبية الأخرى. يسمى الناتج لكل عقدة التنشيط.

يرتبط كل رابط بوزن. ANNs قادرة على التعلم، والذي يتم عن طريق تغيير قيمة الوزن. يوضح الشكل التالي ANN بسيطًا:

أنواع الشبكات العصبية الاصطناعية

هناك نوعان من طبولوجيا الشبكات العصبية الاصطناعية - التغذية الأمامية والتغذية الراجعة.

تدفق المعلومات أحادي الاتجاه. تقوم الوحدة بنقل المعلومات إلى الوحدات الأخرى التي لا تتلقى منها أي معلومات. لا توجد حلقة ردود الفعل. لديهم مدخلات ومخرجات ثابتة.


هنا، يُسمح بحلقات التغذية الراجعة.

كيف تعمل الشبكات العصبية الاصطناعية

تُظهر الهيكلية دوائر، يمثل كل سهم اتصالاً بين خليتين عصبيتين ويشير إلى مسار لتدفق المعلومات. كل اتصال له وزن، وهو عدد صحيح يتحكم في الإشارة بين خليتين عصبيتين.

إذا كانت الشبكة تنتج مخرجات "جيدة" و"مطلوبة"، فلا داعي لضبط الأوزان. ومع ذلك، إذا أنتجت الشبكة مخرجات أو خطأ "سيئًا" أو "غير مرغوب فيه"، يقوم النظام بضبط أوزانه لتحسين النتائج اللاحقة.

التعلم الآلي في الشبكات العصبية الاصطناعية

إن الشبكات العصبية الاصطناعية قادرة على التعلم، ويجب تدريبها. هناك العديد من استراتيجيات التدريس

التدريب - يتضمن قيام المعلم بإرسال عينة تدريبية إلى الشبكة التي يعرف المعلم الإجابات عليها. وتقارن الشبكة نتائجها مع إجابات المعلم وتعدل أوزانها.

يعد التعلم غير الخاضع للرقابة ضروريًا عندما لا يكون هناك مجموعة تدريب ذات إجابات معروفة. على سبيل المثال، في مشاكل التجميع، أي. تقسيم مجموعة من العناصر إلى مجموعات وفق معايير معينة.

التعلم المعزز هو استراتيجية مبنية على الملاحظة. تتخذ الشبكة قراراتها من خلال مراقبة المناطق المحيطة بها. إذا كانت الملاحظة سلبية، تقوم الشبكة بتعديل أوزانها لتتمكن من اتخاذ القرارات المختلفة اللازمة.

خوارزمية الانتشار العكسي

الشبكات الافتراضية (BN)

هذه هي الهياكل الرسومية لتمثيل العلاقات الاحتمالية بين مجموعة من المتغيرات العشوائية.

في هذه الشبكات، تمثل كل عقدة متغيرًا عشوائيًا بعروض محددة. على سبيل المثال، في التشخيص الطبي، تمثل عقدة السرطان افتراضًا بأن المريض مصاب بالسرطان.

تمثل الحواف التي تربط العقد التبعيات الاحتمالية بين هذه المتغيرات العشوائية. إذا كانت إحدى العقدتين تؤثر على العقدة الأخرى، فيجب أن تكونا متصلتين مباشرة. يتم قياس قوة العلاقة بين المتغيرات من خلال الاحتمالية المرتبطة بكل عقدة.

القيد الوحيد على الأقواس في BN هو أنه لا يمكنك العودة إلى العقدة ببساطة عن طريق اتباع اتجاه القوس. ومن ثم يُسمى BNN بالرسم البياني غير الحلقي.

يعد هيكل BN مثاليًا للجمع بين المعرفة والبيانات المرصودة. يمكن استخدام BN لتعلم العلاقات بين السبب والنتيجة وفهم المشكلات المختلفة والتنبؤ بالمستقبل، حتى في حالة عدم وجود بيانات.

أين تستخدم الشبكات العصبية؟

    إنهم قادرون على أداء مهام بسيطة بالنسبة للبشر ولكنها صعبة بالنسبة للآلات:

    الفضاء الجوي - الطيار الآلي للطائرات؛

    السيارات - أنظمة توجيه السيارات؛

    العسكرية - تتبع الهدف، الطيار الآلي، التعرف على الإشارة/الصورة؛

    الإلكترونيات - التنبؤ، تحليل الأخطاء، رؤية الآلة، التركيب الصوتي؛

    الشؤون المالية - تقييم العقارات، استشارات الائتمان، الرهن العقاري، محفظة الشركات التجارية، إلخ.

    معالجة الإشارات - يمكن تدريب الشبكات العصبية على معالجة الإشارة الصوتية.

تظهر أنواع جديدة من بنيات الشبكات العصبية طوال الوقت، وقد تصبح مربكة. لقد قمنا بتجميع ما يشبه ورقة الغش من أجلك، والتي تحتوي على معظم أنواع ANN الموجودة. وعلى الرغم من تقديمها جميعًا على أنها فريدة من نوعها، إلا أن الصور تشير إلى أن الكثير منها متشابه جدًا.

تكمن مشكلة الرسوم البيانية أعلاه في أنها لا توضح كيفية استخدام الشبكات المقابلة عمليًا. على سبيل المثال، تبدو أجهزة التشفير التلقائي المتغيرة (VAE) تمامًا مثل أجهزة التشفير التلقائي البسيطة (AE)، لكن عمليات التعلم الخاصة بها تختلف بشكل كبير. تختلف حالات الاستخدام بشكل أكبر لأن VAE عبارة عن مذبذب يتم تغذيته بضوضاء جديدة لإنتاج عينة جديدة. يقوم AE ببساطة بمقارنة البيانات المستلمة مع العينة الأكثر تشابهًا التي تم الحصول عليها أثناء التدريب.

ومن الجدير بالذكر أنه على الرغم من أن معظم هذه الاختصارات مقبولة بشكل عام، إلا أن هناك استثناءات. يقصدون أحيانًا بـ RNN شبكة عصبية متكررة، لكنهم عادةً ما يقصدون شبكة عصبية متكررة. يمكنك أيضًا في كثير من الأحيان رؤية استخدام اختصار RNN عند الحديث عنه أي NS المتكررة. تواجه أجهزة التشفير التلقائي أيضًا هذه المشكلة عندما تسمى أجهزة التشفير التلقائي المتغيرة والمخفضة للضوضاء (VAE، DAE) ببساطة بأجهزة التشفير التلقائي (AE). بالإضافة إلى ذلك، تختلف العديد من الاختصارات في عدد الأحرف "N" في النهاية، حيث يتم استخدام "الشبكة العصبية" في بعض الحالات، وفي حالات أخرى يتم استخدام "الشبكة" ببساطة.

سيتم تقديم وصف مختصر جدًا لكل بنية ورابط لمقالة مخصصة لها. إذا كنت تريد التعرف بسرعة على الشبكات العصبية من الصفر، فاتبع برنامجنا التعليمي المترجم، والذي يتكون من أربع خطوات فقط.


الشبكات العصبية المغذية
(تغذية الشبكات العصبية للأمام، FF أو FFNN) والإدراك (الإدراك الحسي، P)واضحة جدًا، فهي تنقل المعلومات من الإدخال إلى الإخراج. غالبًا ما توصف الشبكات العصبية بأنها كعكة طبقات، حيث تتكون كل طبقة من خلايا الإدخال أو المخفية أو خلايا الإخراج. الخلايا في طبقة واحدة غير متصلة ببعضها البعض، في حين أن الطبقات المجاورة عادة ما تكون متصلة بشكل كامل. أبسط شبكة عصبية تحتوي على خليتين إدخال وخلية إخراج واحدة، ويمكن استخدامها كنموذج للبوابات المنطقية. يتم تدريب FFNN عادةً باستخدام الانتشار العكسي، حيث تتلقى الشبكة مدخلات ومخرجات متعددة. تسمى هذه العملية بالتعلم الخاضع للإشراف، وهي تختلف عن التعلم غير الخاضع للإشراف في أنه في الحالة الثانية تقوم الشبكة بتجميع الكثير من بيانات المخرجات بنفسها. الخطأ أعلاه هو الفرق بين الإدخال والإخراج. إذا كانت الشبكة تحتوي على ما يكفي من الخلايا العصبية المخفية، فإنها تكون قادرة نظريًا على نمذجة التفاعل بين المدخلات والمخرجات. ومن الناحية العملية، نادرًا ما يتم استخدام مثل هذه الشبكات، ولكن غالبًا ما يتم دمجها مع أنواع أخرى لإنشاء شبكات جديدة.

الشبكات وظائف أساس شعاعي (وظيفة الأساس الشعاعي، RBF)عبارة عن FFNN يستخدم وظائف الأساس الشعاعي كوظائف تنشيط. فهي لم تعد تبرز :)

شبكة هوبفيلد العصبية(شبكة هوبفيلد، HN)هي شبكة عصبية متصلة بالكامل مع مصفوفة اتصال متماثلة. أثناء تلقي بيانات الإدخال، تكون كل عقدة بمثابة مدخلات، وأثناء عملية التدريب تصبح مخفية، ثم تصبح مخرجات. يتم تدريب الشبكة على هذا النحو: يتم ضبط قيم الخلايا العصبية وفقًا للنمط المطلوب، وبعد ذلك يتم حساب الأوزان التي لا تتغير لاحقًا. بمجرد تدريب الشبكة على واحد أو أكثر من الأنماط، فإنها ستتقارب دائمًا مع أحد هذه الأنماط (ولكن ليس دائمًا مع النمط المطلوب). يستقر اعتمادًا على "الطاقة" و "درجة الحرارة" الإجمالية للشبكة. كل خلية عصبية لها عتبة تنشيط خاصة بها تعتمد على درجة الحرارة، وبعدها تأخذ الخلية العصبية إحدى القيمتين (عادة -1 أو 1، وأحيانًا 0 أو 1). غالبًا ما تسمى هذه الشبكة بشبكة الذاكرة الترابطية؛ تمامًا كما يمكن لأي شخص، عندما يرى نصف الطاولة، أن يتخيل النصف الثاني من الطاولة، فإن هذه الشبكة، التي تستقبل طاولة نصفها صاخبة، تعيدها إلى الطاولة الكاملة.

سلاسل ماركوف(سلاسل ماركوف، MC أو سلاسل ماركوف الزمنية المنفصلة، ​​DTMC)هي أسلاف آلات بولتزمان (BM) وشبكات هوبفيلد (HN). يمكن تفسير معناها على النحو التالي: ما هي فرصتي في الدخول إلى إحدى العقد التالية إذا كنت في هذه العقدة؟ كل حالة لاحقة تعتمد فقط على الحالة السابقة. على الرغم من أن سلاسل ماركوف ليست في الواقع NNs، إلا أنها متشابهة تمامًا. كما أن سلاسل ماركوف ليست بالضرورة متصلة بشكل كامل.

آلة بولتزمان(آلة بولتزمان، BM)تشبه إلى حد كبير شبكة هوبفيلد، ولكن يتم تمييز بعض الخلايا العصبية فيها كمدخلات والبعض الآخر مخفية. تصبح الخلايا العصبية المدخلة فيما بعد خلايا عصبية الإخراج. آلة بولتزمان هي شبكة عشوائية. يتم التدريب باستخدام طريقة الانتشار العكسي أو خوارزمية التباعد المقارن. بشكل عام، عملية التعلم مشابهة جدًا لعملية التعلم في شبكة هوبفيلد.

آلة بولتزمان المقيدة(آلة بولتزمان المقيدة، RBM)يشبه بشكل ملحوظ آلة بولتزمان وبالتالي شبكة هوبفيلد. والفرق الوحيد هو حدودها. وفيه لا ترتبط الخلايا العصبية من نفس النوع ببعضها البعض. يمكن تدريب آلة بولتزمان المقيدة مثل FFNN، ولكن مع تحذير واحد: بدلاً من نقل البيانات للأمام والانتشار العكسي، تحتاج إلى نقل البيانات أولاً في الاتجاه الأمامي، ثم في الاتجاه العكسي. بعد ذلك، يتم التدريب باستخدام طريقة انتشار الأخطاء للأمام والخلف.

التشفير التلقائي(التشفير التلقائي، AE)يشبه إلى حد ما FFNN من حيث أنه طريقة مختلفة لاستخدام FFNN بدلاً من بنية مختلفة بشكل أساسي. الفكرة الرئيسية هي التشفير التلقائي (بمعنى الضغط وليس التشفير) للمعلومات. الشبكة نفسها على شكل ساعة رملية، وطبقاتها المخفية أصغر من المدخلات والمخرجات، وهي متناظرة. يمكن تدريب الشبكة باستخدام الانتشار العكسي عن طريق تغذية بيانات الإدخال وتعيين الخطأ ليكون الفرق بين الإدخال والإخراج.

التشفير التلقائي متناثر(جهاز التشفير التلقائي المتناثر، SAE)- بمعنى عكس المعتاد. بدلاً من تدريب الشبكة على عرض المعلومات في "حجم" أصغر من العقد، نقوم بزيادة عددها. فبدلاً من التضييق باتجاه المركز، تتضخم الشبكة هناك. تعد هذه الأنواع من الشبكات مفيدة في التعامل مع عدد كبير من الخصائص الصغيرة لمجموعة البيانات. إذا قمت بتدريب الشبكة مثل جهاز التشفير التلقائي العادي، فلن يأتي منها شيء مفيد. ولذلك، بالإضافة إلى البيانات المدخلة، يتم أيضًا توفير مرشح متفرق خاص، والذي يسمح فقط بمرور أخطاء معينة.

أجهزة الترميز التلقائي المتغيرة(جهاز التشفير التلقائي المتغير، VAE)لديهم بنية مشابهة لـ AE، ولكن علمهم شيئًا مختلفًا: تقريب التوزيع الاحتمالي لعينات المدخلات. في هذا أنها تنشأ من آلات بولتزمان. ومع ذلك، فهم يعتمدون على الرياضيات البايزية عندما يتعلق الأمر بالاستدلال الاحتمالي والاستقلال، وهو أمر بديهي ولكن يصعب تنفيذه. لتلخيص ذلك، يمكننا القول أن هذه الشبكة تأخذ في الاعتبار تأثير الخلايا العصبية. فإذا حدث شيء في مكان، وحدث شيء آخر في مكان آخر، فليس بالضرورة أن تكون هذه الأحداث مرتبطة ببعضها البعض، ويجب أن يؤخذ ذلك في الاعتبار.

أجهزة التشفير التلقائي للحد من الضوضاء(تقليل الضوضاء التشفير التلقائي، دبي لصناعات الطيران)هي AEs التي يتم توفير بيانات الإدخال فيها في حالة صاخبة. نحسب الخطأ بنفس الطريقة، ونقارن بيانات الإخراج بالبيانات المزعجة. وهذا يسمح للشبكة بتعلم الاهتمام بالخصائص الأوسع، حيث أن الخصائص الصغيرة يمكن أن تتغير مع الضوضاء.


شبكة الاعتقاد العميق
(شبكات الاعتقاد العميق، DBN)هو الاسم الذي يطلق على نوع من البنية التي تتكون فيها الشبكة من عدة RBMs أو VAEs متصلة. يتم تدريب هذه الشبكات كتلة تلو الأخرى، وكل كتلة تحتاج فقط إلى أن تكون قادرة على تشفير الكتلة السابقة. وتسمى هذه التقنية "التعلم الجشع"، وهي عبارة عن اختيار حلول محلية مثالية لا تضمن نتيجة نهائية مثالية. يمكن أيضًا تدريب الشبكة (باستخدام طريقة الانتشار العكسي) لعرض البيانات في شكل نموذج احتمالي. إذا تم استخدام التعلم غير الخاضع للرقابة، فيمكن استخدام النموذج المستقر لتوليد بيانات جديدة.


الشبكات العصبية التلافيفية
(الشبكات العصبية التلافيفية، سي إن إن)والشبكات العصبية التلافيفية العميقة(الشبكات العصبية التلافيفية العميقة، DCNN)مختلفة جدًا عن أنواع الشبكات الأخرى. وعادة ما تستخدم لمعالجة الصور، وأقل في كثير من الأحيان للصوت. الطريقة النموذجية لاستخدام CNN هي تصنيف الصور: إذا كان هناك قطة في الصورة، ستخرج الشبكة "قطة"، وإذا كان هناك كلب، "كلب". تستخدم مثل هذه الشبكات عادةً "ماسحًا ضوئيًا" لا يقوم بتحليل جميع البيانات مرة واحدة. على سبيل المثال، إذا كان لديك صورة بحجم 200 × 200، فلن تتمكن من معالجة جميع وحدات البكسل البالغ عددها 40 ألف بكسل مرة واحدة. وبدلاً من ذلك، تقوم الشبكة بعدّ مربع بحجم 20 × 20 (عادةً من الزاوية العلوية اليسرى)، ثم تتحرك بمقدار 1 بكسل وتحسب مربعًا جديدًا، وهكذا. يتم بعد ذلك تمرير هذه المدخلات عبر طبقات تلافيفية، حيث لا ترتبط جميع العقد ببعضها البعض. تميل هذه الطبقات إلى الانكماش مع العمق، وغالبًا ما تستخدم قوى اثنين: 32، 16، 8، 4، 2، 1. في الممارسة العملية، يتم ربط FFNN بنهاية CNN لمزيد من معالجة البيانات. تسمى هذه الشبكات بالشبكات العميقة (DCNN).

تتكشف الشبكات العصبية(الشبكات اللاالتفافية، DN)، وتسمى أيضًا شبكات الرسم البياني العكسي، وهي معكوس الشبكات العصبية التلافيفية. تخيل أنك قمت بتمرير كلمة "قطة" إلى الشبكة، فتقوم بإنشاء صور لقطط تبدو وكأنها صور حقيقية للقطط. يمكن أيضًا دمج DNN مع FFNN. تجدر الإشارة إلى أنه في معظم الحالات لا يتم إرسال سلسلة إلى الشبكة، بل ناقل ثنائي: على سبيل المثال،<0, 1>- انها قطة،<1, 0>- كلب و<1, 1>- قطة وكلب.

الشبكة العصبية الاصطناعية عبارة عن مجموعة من الخلايا العصبية التي تتفاعل مع بعضها البعض. إنهم قادرون على تلقي ومعالجة وإنشاء البيانات. من الصعب تخيل كيفية عمل الدماغ البشري. تعمل الشبكة العصبية في دماغنا بحيث يمكنك قراءة هذا الآن: تتعرف خلايانا العصبية على الحروف وتحولها إلى كلمات.

الشبكة العصبية الاصطناعية تشبه الدماغ. تمت برمجته في الأصل لتبسيط بعض عمليات الحوسبة المعقدة. تتمتع الشبكات العصبية اليوم بإمكانيات أكبر بكثير. بعضها موجود على هاتفك الذكي. لقد سجل جزء آخر بالفعل في قاعدة البيانات الخاصة به أنك فتحت هذه المقالة. كيف يحدث كل هذا ولماذا، واصل القراءة.

كيف بدأ كل شيء

أراد الناس حقًا أن يفهموا من أين يأتي عقل الشخص وكيف يعمل الدماغ. في منتصف القرن الماضي، أدرك عالم النفس العصبي الكندي دونالد هيب ذلك. درس هب تفاعل الخلايا العصبية مع بعضها البعض، ودرس المبدأ الذي يتم من خلاله دمجها في مجموعات (من الناحية العلمية - المجموعات) واقترح أول خوارزمية في العلوم لتدريب الشبكات العصبية.

وبعد سنوات قليلة، قامت مجموعة من العلماء الأمريكيين بتصميم شبكة عصبية اصطناعية يمكنها تمييز الأشكال المربعة عن الأشكال الأخرى.

كيف تعمل الشبكة العصبية؟

لقد وجد الباحثون أن الشبكة العصبية هي عبارة عن مجموعة من طبقات الخلايا العصبية، كل منها مسؤولة عن التعرف على معيار معين: الشكل، اللون، الحجم، الملمس، الصوت، الحجم، وما إلى ذلك. سنة بعد سنة، نتيجة لملايين من التجارب وأطنان من الحسابات، تمت إضافة الإضافات إلى أبسط شبكة جديدة وطبقات جديدة من الخلايا العصبية. إنهم يعملون بالتناوب. على سبيل المثال، يحدد الأول ما إذا كان المربع مربعًا أم لا، والثاني يفهم ما إذا كان المربع أحمر أم لا، والثالث يحسب حجم المربع، وهكذا. لا تنتهي الأشكال المربعة، ولا الحمراء، والأشكال ذات الحجم غير المناسب في مجموعات جديدة من الخلايا العصبية ويتم استكشافها بواسطتها.

ما هي الشبكات العصبية وماذا يمكنها أن تفعل؟

طور العلماء شبكات عصبية حتى يتمكنوا من التمييز بين الصور ومقاطع الفيديو والنصوص والكلام المعقدة. هناك أنواع عديدة من الشبكات العصبية اليوم. يتم تصنيفها اعتمادًا على البنية - مجموعات معلمات البيانات ووزن هذه المعلمات، ذات أولوية معينة. وفيما يلي بعض منها.

الشبكات العصبية التلافيفية

تنقسم الخلايا العصبية إلى مجموعات، كل مجموعة تحسب صفة معينة لها. في عام 1993، أظهر العالم الفرنسي يان ليكون للعالم شبكة LeNet 1، وهي أول شبكة عصبية تلافيفية يمكنها التعرف بسرعة ودقة على الأرقام المكتوبة على الورق باليد. انظر بنفسك:

اليوم، تُستخدم الشبكات العصبية التلافيفية بشكل أساسي لأغراض الوسائط المتعددة: فهي تعمل مع الرسومات والصوت والفيديو.

الشبكات العصبية المتكررة

تتذكر الخلايا العصبية المعلومات بشكل تسلسلي وتبني المزيد من الإجراءات بناءً على هذه البيانات. وفي عام 1997، قام علماء ألمان بتعديل أبسط الشبكات المتكررة إلى شبكات ذات ذاكرة طويلة وقصيرة المدى. وبناءً عليها، تم تطوير شبكات ذات خلايا عصبية متكررة يتم التحكم فيها.

واليوم، بمساعدة مثل هذه الشبكات، تتم كتابة النصوص وترجمتها، ويتم برمجة الروبوتات لإجراء حوارات هادفة مع البشر، ويتم إنشاء رموز الصفحات والبرامج.

يعد استخدام هذا النوع من الشبكات العصبية فرصة لتحليل البيانات وتوليدها وتجميع قواعد البيانات وحتى إجراء التنبؤات.

في عام 2015، أصدرت SwiftKey أول لوحة مفاتيح في العالم تعمل على شبكة عصبية متكررة مع خلايا عصبية يمكن التحكم فيها. ثم قدم النظام تلميحات أثناء الكتابة بناءً على الكلمات الأخيرة التي تم إدخالها. في العام الماضي، قام المطورون بتدريب شبكة عصبية لدراسة سياق النص الذي يتم كتابته، وأصبحت التلميحات ذات معنى ومفيدة:

الشبكات العصبية المدمجة (التلافيفية + المتكررة)

هذه الشبكات العصبية قادرة على فهم ما هو موجود في الصورة ووصفه. والعكس: ارسم الصور حسب الوصف. المثال الأكثر وضوحا تم عرضه من قبل كايل ماكدونالد، الذي أخذ شبكة عصبية في نزهة حول أمستردام. حددت الشبكة على الفور ما كان أمامها. ودائمًا ما يكون بالضبط:

الشبكات العصبية تتعلم ذاتيًا باستمرار. من خلال هذه العملية:

1. قدمت Skype إمكانات الترجمة الفورية لـ 10 لغات. من بينها، للحظة، هناك الروسية واليابانية - وهي من أصعب اللغات في العالم. بالطبع، تتطلب جودة الترجمة تحسينًا جديًا، ولكن حقيقة أنه يمكنك الآن التواصل مع زملائك من اليابان باللغة الروسية والتأكد من أنه سيتم فهمك، أمر ملهم.

2. أنشأت ياندكس خوارزميتين للبحث تعتمدان على الشبكات العصبية: "Palekh" و"Korolev". الأول ساعد في العثور على المواقع الأكثر صلة بالاستعلامات ذات التردد المنخفض. قام "باليخ" بدراسة عناوين الصفحات ومقارنة معناها بمعنى الاستعلامات. بناء على Palekh، ظهر كوروليف. لا تقوم هذه الخوارزمية بتقييم العنوان فحسب، بل تقوم أيضًا بتقييم محتوى النص بالكامل للصفحة. أصبح البحث أكثر دقة، وبدأ مالكو المواقع في التعامل مع محتوى الصفحة بشكل أكثر ذكاءً.

3. أنشأ زملاء SEO من Yandex شبكة عصبية موسيقية: فهي تؤلف الشعر وتكتب الموسيقى. يُطلق على المجموعة العصبية رمزيًا اسم Neurona، ولديها بالفعل ألبومها الأول:

4. يستخدم Google Inbox الشبكات العصبية للرد على الرسائل. يجري تطوير التكنولوجيا على قدم وساق، واليوم تقوم الشبكة بالفعل بدراسة المراسلات وإنشاء خيارات الاستجابة الممكنة. ليس عليك إضاعة الوقت في الكتابة ولا تخف من نسيان بعض الاتفاقيات المهمة.

5. يستخدم موقع YouTube الشبكات العصبية لتصنيف مقاطع الفيديو، ووفقًا لمبدأين في وقت واحد: تقوم إحدى الشبكات العصبية بدراسة مقاطع الفيديو وردود أفعال الجمهور تجاهها، وتقوم الأخرى بإجراء أبحاث حول المستخدمين وتفضيلاتهم. ولهذا السبب تكون توصيات YouTube دائمًا في محلها.

6. يعمل Facebook بنشاط على DeepText AI، وهو برنامج اتصالات يفهم المصطلحات وينظف الدردشات من اللغة البذيئة.

7. تقوم تطبيقات مثل Prisma وFabby، المبنية على الشبكات العصبية، بإنشاء الصور ومقاطع الفيديو:

يقوم Colorize باستعادة الألوان في الصور بالأبيض والأسود (مفاجأة الجدة!).

تختار شركة MakeUp Plus أحمر الشفاه المثالي للفتيات من مجموعة حقيقية من العلامات التجارية الحقيقية: Bobbi Brown وClinique وLancome وYSL تعمل بالفعل.


8.
تعمل Apple وMicrosoft باستمرار على ترقية نظامي Siri وContana العصبيين. في الوقت الحالي، إنهم ينفذون أوامرنا فقط، ولكن في المستقبل القريب سيبدأون في أخذ زمام المبادرة: تقديم التوصيات وتوقع رغباتنا.

ماذا ينتظرنا في المستقبل؟

يمكن للشبكات العصبية ذاتية التعلم أن تحل محل الأشخاص: ستبدأ بمؤلفي النصوص والمراجعين. تقوم الروبوتات بالفعل بإنشاء نصوص ذات معنى وبدون أخطاء. وهم يفعلون ذلك بشكل أسرع بكثير من الناس. وسيستمرون مع موظفي مركز الاتصال والدعم الفني والمشرفين ومديري الصفحات العامة على الشبكات الاجتماعية. الشبكات العصبية قادرة بالفعل على تعلم النص وإعادة إنتاجه بصوت. ماذا عن المناطق الأخرى؟

القطاع الزراعي

سيتم تنفيذ الشبكة العصبية في معدات خاصة. ستقوم آلات الحصاد بالقيادة الآلية، ومسح النباتات ودراسة التربة، ونقل البيانات إلى شبكة عصبية. سوف تقرر ما إذا كانت ستسقي أو تسميد أو ترش ضد الآفات. بدلاً من بضع عشرات من العمال، ستحتاج إلى متخصصين اثنين على الأكثر: مشرف وفني.

الدواء

تعمل Microsoft حاليًا بنشاط على إنشاء علاج للسرطان. ينخرط العلماء في البرمجة الحيوية - فهم يحاولون رقمنة عملية ظهور الأورام وتطورها. عندما ينجح كل شيء، سيتمكن المبرمجون من إيجاد طريقة لمنع مثل هذه العملية، وسيتم إنشاء دواء عن طريق القياس.

تسويق

التسويق شخصي للغاية. بالفعل، يمكن للشبكات العصبية أن تحدد في ثوانٍ المحتوى الذي سيتم عرضه لكل مستخدم وبأي سعر. في المستقبل، سيتم تقليل مشاركة المسوق في العملية إلى الحد الأدنى: ستقوم الشبكات العصبية بالتنبؤ بالاستعلامات بناءً على بيانات سلوك المستخدم، ومسح السوق وتقديم العروض الأكثر ملاءمة بحلول الوقت الذي يفكر فيه الشخص في الشراء.

التجارة الإلكترونية

سيتم تنفيذ التجارة الإلكترونية في كل مكان. لم تعد بحاجة للذهاب إلى المتجر عبر الإنترنت باستخدام رابط: يمكنك شراء كل ما تراه بنقرة واحدة. على سبيل المثال، أنت تقرأ هذه المقالة بعد عدة سنوات. لقد أعجبك حقًا أحمر الشفاه الموجود في لقطة الشاشة من تطبيق MakeUp Plus (انظر أعلاه). تضغط عليه وتذهب مباشرة إلى العربة. أو شاهد مقطع فيديو حول أحدث طراز من Hololens (نظارات الواقع المختلط) وقم بتقديم طلب على الفور مباشرةً من YouTube.

في كل مجال تقريبًا، سيتم تقدير المتخصصين ذوي المعرفة أو على الأقل فهم بنية الشبكات العصبية والتعلم الآلي وأنظمة الذكاء الاصطناعي. سنعيش مع الروبوتات جنبًا إلى جنب. وكلما عرفنا المزيد عنهم، أصبحت حياتنا أكثر هدوءًا.

ملاحظة. Zinaida Falls هي شبكة عصبية ياندكس تكتب الشعر. قم بتقييم العمل الذي كتبته الآلة بعد تدريبها على يد ماياكوفسكي (تم الحفاظ على التهجئة وعلامات الترقيم):

« هذا»

هذا
فقط كل شيء
شئ ما
في المستقبل
و القوة
ذلك الشخص
هل كل شيء في العالم أم لا
هناك دماء في كل مكان
اتفاق
الحصول على الدهون
المجد ل
أرض
مع اثارة ضجة في المنقار

مثير للإعجاب، أليس كذلك؟

في النصف الأول من عام 2016، سمع العالم عن العديد من التطورات في مجال الشبكات العصبية - جوجل (Go Network player AlphaGo)، مايكروسوفت (عدد من الخدمات للتعرف على الصور)، الشركات الناشئة MSQRD، Prisma وغيرها أظهرت خوارزمياتها.

إلى الإشارات المرجعية

يخبرك محررو الموقع ما هي الشبكات العصبية، وما هي الحاجة إليها، ولماذا استولت على الكوكب الآن، وليس قبل سنوات أو بعد ذلك بسنوات، وما هو المبلغ الذي يمكنك كسبه منها ومن هم اللاعبون الرئيسيون في السوق. كما شارك خبراء من MIPT وYandex وMail.Ru Group وMicrosoft آرائهم.

ما هي الشبكات العصبية وما هي المشاكل التي يمكنها حلها؟

تعد الشبكات العصبية أحد الاتجاهات في تطوير أنظمة الذكاء الاصطناعي. وتتمثل الفكرة في وضع نموذج دقيق قدر الإمكان لعمل الجهاز العصبي البشري - أي قدرته على التعلم وتصحيح الأخطاء. هذه هي الميزة الرئيسية لأي شبكة عصبية - فهي قادرة على التعلم بشكل مستقل والتصرف بناءً على الخبرة السابقة، مع ارتكاب أخطاء أقل وأقل في كل مرة.

لا تحاكي الشبكة العصبية النشاط فحسب، بل تحاكي أيضًا بنية الجهاز العصبي البشري. تتكون هذه الشبكة من عدد كبير من عناصر الحوسبة الفردية ("الخلايا العصبية"). في معظم الحالات، تنتمي كل "خلية عصبية" إلى طبقة معينة من الشبكة. تتم معالجة بيانات الإدخال بشكل تسلسلي في جميع طبقات الشبكة. يمكن أن تتغير معلمات كل "خلية عصبية" اعتمادًا على النتائج التي تم الحصول عليها من مجموعات سابقة من بيانات الإدخال، وبالتالي تغيير ترتيب تشغيل النظام بأكمله.

يشير رئيس قسم البحث في Mail.ru في مجموعة Mail.Ru، أندريه كالينين، إلى أن الشبكات العصبية قادرة على حل نفس المشكلات مثل خوارزميات التعلم الآلي الأخرى، والفرق يكمن فقط في نهج التدريب.

ترتبط جميع المهام التي يمكن للشبكات العصبية حلها بطريقة أو بأخرى بالتعلم. من بين المجالات الرئيسية لتطبيق الشبكات العصبية التنبؤ واتخاذ القرار والتعرف على الأنماط والتحسين وتحليل البيانات.

ويشير مدير برامج التعاون التكنولوجي في مايكروسوفت في روسيا، فلاد شيرشولسكي، إلى أن الشبكات العصبية تُستخدم الآن في كل مكان: “على سبيل المثال، تستخدمها العديد من مواقع الإنترنت الكبيرة لجعل ردود الفعل على سلوك المستخدم أكثر طبيعية ومفيدة لجمهورها. تشكل الشبكات العصبية أساس معظم أنظمة التعرف على الكلام وتركيبه الحديثة، بالإضافة إلى التعرف على الصور ومعالجتها. ويتم استخدامها في بعض أنظمة الملاحة، سواء كانت الروبوتات الصناعية أو السيارات ذاتية القيادة. تعمل الخوارزميات المبنية على الشبكات العصبية على حماية أنظمة المعلومات من هجمات المتسللين وتساعد في تحديد المحتوى غير القانوني على الشبكة.

يعتقد شيرشولسكي أنه في المستقبل القريب (من 5 إلى 10 سنوات)، سيتم استخدام الشبكات العصبية على نطاق أوسع:

تخيل حصادة زراعية، تم تجهيز مشغلاتها بالعديد من كاميرات الفيديو. فهو يلتقط خمسة آلاف صورة في الدقيقة لكل نبات في مساره، وباستخدام شبكة عصبية، يحلل ما إذا كان من الأعشاب الضارة، وما إذا كان متأثرًا بالأمراض أو الآفات. ويتم التعامل مع كل نبات على حدة. رائع؟ ليس تماما بعد الآن. وفي غضون خمس سنوات قد يصبح هو القاعدة. - فلاد شيرشولسكي، مايكروسوفت

يقدم ميخائيل بورتسيف، رئيس مختبر الأنظمة العصبية والتعلم العميق في مركز MIPT للأنظمة الحية، خريطة مبدئية لتطوير الشبكات العصبية لعامي 2016-2018:

  • أنظمة التعرف على الأشياء وتصنيفها في الصور؛
  • واجهات التفاعل الصوتي لإنترنت الأشياء؛
  • أنظمة مراقبة جودة الخدمة في مراكز الاتصال؛
  • أنظمة تحديد المشاكل (بما في ذلك التنبؤ بوقت الصيانة)، والحالات الشاذة، والتهديدات المادية السيبرانية؛
  • أنظمة الأمن والمراقبة الفكرية؛
  • استبدال بعض وظائف مشغلي مراكز الاتصال بالروبوتات؛
  • أنظمة تحليل الفيديو؛
  • أنظمة التعلم الذاتي التي تعمل على تحسين إدارة تدفقات المواد أو موقع الأشياء (في المستودعات والنقل)؛
  • وأنظمة تحكم ذكية ذاتية التعلم لعمليات وأجهزة الإنتاج (بما في ذلك الروبوتات)؛
  • وظهور أنظمة ترجمة فورية عالمية للمؤتمرات والاستخدام الشخصي؛
  • ظهور مستشارين أو مساعدين شخصيين للدعم الفني بوظائف مشابهة لوظائف الإنسان.

يعتقد مدير توزيع التكنولوجيا في ياندكس غريغوري باكونوف أن أساس انتشار الشبكات العصبية في السنوات الخمس المقبلة سيكون قدرة هذه الأنظمة على اتخاذ قرارات مختلفة: "الشيء الرئيسي الذي تفعله الشبكات العصبية للإنسان الآن هو إنقاذ له من اتخاذ القرارات غير الضرورية. لذلك يمكن استخدامها في أي مكان تقريبًا حيث لا يتخذ شخص حي قرارات ذكية جدًا. وفي السنوات الخمس المقبلة، سيتم استغلال هذه المهارة، التي ستحل محل عملية صنع القرار البشري بآلة بسيطة.

لماذا أصبحت الشبكات العصبية شائعة جدًا الآن؟

لقد عمل العلماء على تطوير الشبكات العصبية الاصطناعية منذ أكثر من 70 عامًا. تعود أول محاولة لإضفاء الطابع الرسمي على الشبكة العصبية إلى عام 1943، عندما قدم عالمان أمريكيان (وارن ماكولوتش ووالتر بيتس) مقالًا عن الحساب المنطقي للأفكار البشرية والنشاط العصبي.

ومع ذلك، حتى وقت قريب، كما يقول أندريه كالينين من مجموعة Mail.Ru، كانت سرعة الشبكات العصبية منخفضة جدًا بحيث لا يمكن انتشارها على نطاق واسع، وبالتالي تم استخدام مثل هذه الأنظمة بشكل أساسي في التطورات المتعلقة برؤية الكمبيوتر، وفي مجالات أخرى تم استخدام خوارزميات أخرى التعلم الالي.

يعد التدريب جزءًا كثيف العمالة ويستغرق وقتًا طويلاً في عملية تطوير الشبكة العصبية. لكي تتمكن الشبكة العصبية من حل المشكلات المعينة بشكل صحيح، يتعين عليها "تشغيل" عملها على عشرات الملايين من مجموعات بيانات الإدخال. مع ظهور العديد من تقنيات التعلم السريع، ربط أندريه كالينين وغريغوري باكونوف انتشار الشبكات العصبية.

الشيء الرئيسي الذي حدث الآن هو ظهور حيل مختلفة تتيح لك إنشاء شبكات عصبية أقل عرضة لإعادة التدريب - غريغوري باكونوف، ياندكس

"أولاً، ظهرت مجموعة كبيرة ومتاحة للجمهور من الصور ذات العلامات (ImageNet) والتي يمكنك التعلم منها. ثانيا، تتيح لك بطاقات الفيديو الحديثة تدريب الشبكات العصبية واستخدامها بشكل أسرع مئات المرات. ثالثا، ظهرت شبكات عصبية جاهزة ومدربة مسبقا تتعرف على الصور، والتي على أساسها يمكنك إنشاء تطبيقاتك الخاصة دون الحاجة إلى قضاء وقت طويل في إعداد الشبكة العصبية للعمل. كل هذا يضمن تطورًا قويًا جدًا للشبكات العصبية على وجه التحديد في مجال التعرف على الصور.

ما هو حجم سوق الشبكات العصبية؟

"من السهل جدًا الحساب. يمكنك أن تأخذ أي مجال يستخدم عمالة منخفضة المهارة، مثل وكلاء مركز الاتصال، وتطرح ببساطة جميع الموارد البشرية. أود أن أقول إننا نتحدث عن سوق بمليارات الدولارات، حتى داخل دولة واحدة. من السهل أن نفهم عدد الأشخاص في العالم الذين يعملون في وظائف منخفضة المهارات. يقول غريغوري باكونوف، مدير توزيع التكنولوجيا في ياندكس: "حتى لو تحدثنا بشكل تجريدي للغاية، أعتقد أننا نتحدث عن سوق بقيمة مائة مليار دولار في جميع أنحاء العالم".

وفقًا لبعض التقديرات، سيتم أتمتة أكثر من نصف المهن - وهذا هو الحد الأقصى للحجم الذي يمكن من خلاله زيادة سوق خوارزميات التعلم الآلي (والشبكات العصبية على وجه الخصوص) - أندريه كالينين، مجموعة Mail.Ru

"إن خوارزميات التعلم الآلي هي الخطوة التالية في أتمتة أي عمليات، في تطوير أي برنامج. لذلك، يتزامن السوق على الأقل مع سوق البرمجيات بأكمله، بل يتجاوزه، لأنه يصبح من الممكن تقديم حلول ذكية جديدة لا يمكن الوصول إليها من قبل البرامج القديمة،" يتابع أندريه كالينين، رئيس قسم البحث في Mail.ru في Mail. مجموعة رو.

لماذا يقوم مطورو الشبكات العصبية بإنشاء تطبيقات الهاتف المحمول للسوق الشامل

في الأشهر القليلة الماضية، ظهرت في السوق العديد من المشاريع الترفيهية رفيعة المستوى التي تستخدم الشبكات العصبية - وهي خدمة الفيديو الشهيرة، وشبكة التواصل الاجتماعي Facebook، والتطبيقات الروسية لمعالجة الصور (استثمارات من مجموعة Mail.Ru في يونيو) و آحرون.

تم عرض قدرات شبكاتهم العصبية من قبل كل من Google (فازت تقنية AlphaGo على البطل في Go؛ في مارس 2016، باعت الشركة في مزاد علني 29 لوحة مرسومة بالشبكات العصبية، وما إلى ذلك)، وMicrosoft (مشروع CaptionBot، الذي يتعرف على الصور في الصور الفوتوغرافية ويقوم تلقائيًا بإنشاء تسميات توضيحية لها؛ ومشروع WhatDog، الذي يحدد سلالة الكلب من الصورة؛ وخدمة HowOld، التي تحدد عمر الشخص في الصورة، وما إلى ذلك)، وYandex (في في يونيو، قام الفريق بدمج خدمة التعرف على السيارات في الصور الفوتوغرافية في تطبيق Avto.ru؛ قدم تسجيلا موسيقيا مسجلا بواسطة ألبوم الشبكات العصبية؛ في مايو، أنشأت مشروع LikeMo.net للرسم بأسلوب الفنانين المشهورين).

يتم إنشاء هذه الخدمات الترفيهية ليس لحل المشكلات العالمية التي تهدف إليها الشبكات العصبية، ولكن لإظهار قدرات الشبكة العصبية وإجراء تدريباتها.

"الألعاب هي سمة مميزة لسلوكنا كنوع. من ناحية، يمكن استخدام مواقف اللعبة لمحاكاة جميع السيناريوهات النموذجية للسلوك البشري تقريبًا، ومن ناحية أخرى، يمكن لمنشئي الألعاب، وخاصة اللاعبين، الحصول على الكثير من المتعة من هذه العملية. هناك أيضًا جانب نفعي بحت. إن اللعبة المصممة جيدًا لا تجلب الرضا للاعبين فحسب، بل إنهم يقومون أثناء اللعب بتدريب خوارزمية الشبكة العصبية. يقول فلاد شيرشولسكي من شركة مايكروسوفت: "في نهاية المطاف، تعتمد الشبكات العصبية على التعلم بالقدوة".

"بادئ ذي بدء، يتم ذلك لإظهار قدرات التكنولوجيا. لا يوجد حقا سبب آخر. إذا كنا نتحدث عن بريزما، فمن الواضح لماذا فعلوا ذلك. قام الرجال ببناء نوع من خطوط الأنابيب التي تسمح لهم بالعمل مع الصور. ولإثبات ذلك، اختاروا طريقة بسيطة إلى حد ما لإنشاء الأنماط. ولم لا؟ يقول غريغوري باكونوف من ياندكس: "هذا مجرد عرض لكيفية عمل الخوارزميات".

لدى أندريه كالينين من مجموعة Mail.Ru رأي مختلف: "بالطبع، هذا مثير للإعجاب من وجهة نظر الجمهور. ومن ناحية أخرى، لا أستطيع أن أقول إن المنتجات الترفيهية لا يمكن تطبيقها على مجالات أكثر فائدة. على سبيل المثال، تعد مهمة تصميم الصور ذات صلة للغاية بعدد من الصناعات (التصميم وألعاب الكمبيوتر والرسوم المتحركة ليست سوى أمثلة قليلة)، ويمكن أن يؤدي الاستخدام الكامل للشبكات العصبية إلى تحسين تكلفة وطرق إنشاء المحتوى لها بشكل كبير. "

اللاعبون الرئيسيون في سوق الشبكات العصبية

وكما لاحظ أندريه كالينين، فإن معظم الشبكات العصبية الموجودة في السوق لا تختلف كثيرًا عن بعضها البعض بشكل عام. "التكنولوجيا لدى الجميع هي نفسها تقريبًا. لكن استخدام الشبكات العصبية يعد متعة لا يستطيع الجميع تحملها. لتدريب شبكة عصبية بشكل مستقل وإجراء العديد من التجارب عليها، تحتاج إلى مجموعات تدريب كبيرة وأسطول من الآلات المزودة ببطاقات فيديو باهظة الثمن. ومن الواضح أن الشركات الكبيرة لديها مثل هذه الفرص.

ومن بين اللاعبين الرئيسيين في السوق، يذكر كالينين شركة Google وقسمها Google DeepMind، الذي أنشأ شبكة AlphaGo، وGoogle Brain. لدى Microsoft تطوراتها الخاصة في هذا المجال - يتم تنفيذها بواسطة مختبر أبحاث Microsoft. يتم إنشاء الشبكات العصبية في IBM وFacebook (قسم من Facebook AI Research) وBaidu (معهد Baidu للتعلم العميق) وغيرها. يتم تنفيذ العديد من التطورات في الجامعات التقنية حول العالم.

يشير مدير توزيع التكنولوجيا في Yandex غريغوري باكونوف إلى أن التطورات المثيرة للاهتمام في مجال الشبكات العصبية موجودة أيضًا بين الشركات الناشئة. "أتذكر، على سبيل المثال، شركة ClarifAI. هذه شركة ناشئة صغيرة، أنشأها في السابق أشخاص من Google. والآن ربما هم الأفضل في العالم في تحديد محتوى الصورة. وتشمل هذه الشركات الناشئة MSQRD، وPrisma، وغيرها.

في روسيا، لا يتم تنفيذ التطورات في مجال الشبكات العصبية من قبل الشركات الناشئة فحسب، بل أيضًا من قبل شركات التكنولوجيا الكبيرة - على سبيل المثال، تستخدم مجموعة Mail.Ru Group الشبكات العصبية لمعالجة وتصنيف النصوص في البحث وتحليل الصور. وتقوم الشركة أيضًا بإجراء تطويرات تجريبية تتعلق بالروبوتات وأنظمة المحادثة.

تقوم ياندكس أيضًا بإنشاء شبكاتها العصبية الخاصة: "في الأساس، تُستخدم هذه الشبكات بالفعل في العمل مع الصور والصوت، لكننا نستكشف قدراتها في مجالات أخرى. ونحن الآن نقوم بالكثير من التجارب في استخدام الشبكات العصبية في التعامل مع النص. يتم تنفيذ التطورات في الجامعات: Skoltech، MIPT، جامعة موسكو الحكومية، المدرسة العليا للاقتصاد وغيرها.