حدود الخوارزمية والتحيزات البشرية في مولد الصور بالذكاء الاصطناعي،
كان عام 2022 عام مولدات الصور بالذكاء الاصطناعي.
فعلى مدى السنوات القليلة الماضية، تم تعديل أنظمة التعلم الآلي هذه وصقلها،
حيث خضعت لتكرارات متعددة للعثور على شعبيتها الحالية مع مستخدم الإنترنت اليومي.
مولدات الصور هذه – DALL-E و Midjourney يمكن القول إنها الأبرز تولد صورًا من مجموعة متنوعة من المطالبات النصية،
على سبيل المثال السماح للأشخاص بإنشاء تصورات مفاهيمية لبنيات المستقبل والحاضر والماضي.
ولكن نظرًا لوجودنا في مشهد رقمي مليء بالتحيزات البشرية، فإن التنقل في مولدات الصور هذه يتطلب انعكاسًا دقيقًا.
Midjourney
Midjourney هي أداة ذكاء اصطناعي مثيرة للاهتمام بشكل خاص، وقد أثبتت شعبيتها بين الفنانين والمصممين على حد سواء،
بسبب صورها الخيالية التي تشبه الرسم والتي تم إنشاؤها من مطالبات نصية قليلة جدًا في بعض الأحيان.
لكن النتائج التي تم الحصول عليها باستخدام هذه الأداة تثير أيضًا أسئلة معقدة تتعلق بصنع الصور وتصميمها،
وهي أسئلة تظهر في المقدمة عند استخدام مطالبات مثل “العمارة الأفريقية” لإنتاج الصور.
مصطلح “العمارة الأفريقية” في حد ذاته مثير للجدل تمامًا – قارة من الدول ذات أنماط معمارية مميزة للممارسة.
ولقد كثرت النقاشات في السابق، وما زالت تدور، حول فائدة بعض العلامات الجغرافية مثل “أفريقيا جنوب الصحراء الكبرى”،
ودُور العديد من النقاشات حول الإطار الضار للقارة الأفريقية كدولة واحدة.
في الوقت نفسه، أدى تاريخ الاستعمار الأوروبي في القارة إلى مشاركة كتل من الدول الأفريقية في بنى تحتية استعمارية وما بعد استعمارية مماثلة،
ما يستلزم أحيانًا تجميع بلدان أفريقية مختارة تحت تصنيف مشترك – مثل أوجه التشابه الموجودة في الاستعمار وهياكل الحداثة الاستوائية في عصر الاستقلال في غانا ونيجيريا.
في ميدجورني، أنتجت الكتابة في “العمارة الأفريقية” السريعة صورًا لأشكال تشبه الأكواخ، تعلوها ما يشبه الأسقف المصنوعة من القش في بيئة تبدو ريفية.
وأنتجت “العمارة العامية في إفريقيا” السريعة صورًا متشابهة في الطبيعة، ومباني تشبه الكوخ مع أشجار السنط في الخلفية،
والأرض ذات اللون البني المحمر في المقدمة.
فمن الواضح أن هذه الأشكال شائعة في جميع أنحاء القارة –
من أمثلة العمارة التقليدية لسوكوما الموجودة في متحف بوجورا في مدينة موانزا التنزانية إلى أكواخ الروندفيل الموجودة في جنوب إفريقيا.
ولكن على الرغم من هذه الموجهات العامة – هناك نقص واضح في التنوع في نوع الصور التي تم إنشاؤها،
وإهمال الأشكال مثل المباني الترابية ذات الأسطح المسطحة الموجودة في إقليم ورزازات المغربي،
أو حتى العمارة الحضرية المتنوعة للغاية في المدن الكبرى بأفريقيا .
استخدام مجموعة البيانات العامة
ويعكس توليد الصور من هذه الأنواع مع تلك المحفزات المحددة قضايا أوسع تتعلق بكيفية النظر إلى القارة الأفريقية عبر الإنترنت
– من عدم الوصول إلى المحتوى بالعديد من اللغات الأفريقية إلى الطبيعة المستمرة للسرد الاختزالي حول القارة الأفريقية عبر الويب.
إن الفارق البسيط في إنتاجات “العمارة الأفريقية” بواسطة نموذج مولد الصور ليس واضحًا بشكل مرئي.
ومن أجل المقارنة، وصفت “العمارة الأوروبية” السريعة ما يبدو أنه مناظر شوارع كبيرة ليست في غير محله في بروكسل أو باريس،
ولكن مرة أخرى، هناك نقص في التنوع، حيث يتجنب النموذج المزيد من المباني الحديثة ويغذي الأشكال المعمارية التي من شأنه أن يتناسب مع قالب الكلاسيكية الجديدة.
وعادةً ما تعمل خوارزميات الذكاء الاصطناعي الفنية التوليدية من خلال الاعتماد على بنوك صور كبيرة لموضوع معين لتدريب نماذج الذكاء الاصطناعي الخاصة بهم.
وبالنسبة إلى Midjourney، تُستخدم مجموعات البيانات العامة لإنتاج النتائج الناتجة عن المطالبات النصية،
وبطبيعة الحال، فإن التحيزات الموجودة في الصور المتاحة للجمهور وكيفية تصنيفها سوف تتسرب إلى الفن الذي تم إنشاؤه بواسطة النماذج المدربة على هذه الصور.
من المرجح أن تكون صور “العمارة الأفريقية” و “العمارة العامية في إفريقيا”،
التي تم تأليفها بواسطة الذكاء الاصطناعي هي نتيجة التسميات التوضيحية المبسطة لصور العمارة الأفريقية عبر الإنترنت.
ناهيك عن كيف أن النتائج المرئية لـ “العمارة الأفريقية” يمكن أن تظل أحادية البعد للغاية عندما يقوم أحد بإدخال هذا النص في محرك بحث عبر الإنترنت.
وبالطبع، لدى المرء خيار إدخال مطالبات نصية أكثر تحديدًا في الذكاء الاصطناعي بدلاً من عامة،
وتشمل تسميات مثل “العمارة الأفريقية” أو “العمارة الأوروبية”.
حيث يؤدي دخول “الهندسة المعمارية لنيروبي في الخمسينيات من القرن الماضي”
على سبيل المثال إلى عرض صور لطرق تصطف على جانبيها ناطحات سحاب في العاصمة الكينية تتخللها المساحات الخضراء لمنتزه أوهورو
– بأشكال ضبابية تذكرنا بأبراج تيليبوستا وبرج تايمز في الخلفية.
العمارة الإفريقية
لكن استخدام هذه الحوافز الأكثر دقة لا يزال يعني أن الصور التي تم إنشاؤها من محفزات أوسع نطاقًا في سياق “العمارة الأفريقية”
تعاني من التصورات المعممة بشكل مفرط – مما يعزز سيناريو يكرر الإشكال المسبق للفكرة المرئية للعمارة الأفريقية.
لقد قيل الكثير عن نوع المعرفة السائد في التعلم الآلي وعدد الخوارزميات التي لا تمثل بدقة السياق العالمي الذي نعيش فيه. وكمصممين وفنانين وهواة عاديين
– في الأيام التي لا تزال مبكرة لمولدي صور الذكاء الاصطناعي الأكفاء —استمر في استكشاف واختبار المفاهيم الإبداعية من خلال البرامج،
فمن المفيد التفكير في مقدار هذه الصور التخمينية التي قد تؤدي في النهاية إلى تعزيز الصور النمطية التي من الأفضل للعالم الابتعاد عنها.
للاطلاع على المزيد من الأخبار المعمارية