മനുഷ്യരാശിക്ക് മുൻപൊരിക്കലും സാധിക്കാതിരുന്ന രീതിയില് ദൃശ്യങ്ങൾ സൃഷ്ടിക്കാവുന്ന ഒരു ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് സംവിധനത്തിന്റെ ഏറ്റവും പരിഷ്കരിച്ച പതിപ്പ് എത്തി. ദൂരവ്യാപകമായ പ്രത്യാഘാതങ്ങള് ഉണ്ടാക്കിയേക്കാവുന്ന തരം സോഫ്റ്റ്വെയറാണിത്. ഫോട്ടോകളും ചിത്രങ്ങളും നിര്മിക്കാനടക്കം പ്രയോജനപ്പെടുത്താവുന്ന എഐ മാജിക് ആണിത്. ഇതുടനെ പൊതുജനങ്ങള്ക്കും കലാകാരന്മാര്ക്കും ലഭിക്കും.
ഇതിന് ഗുണവും ദോഷവും ഉണ്ടെന്നതാണ്, ഇത് എങ്ങനെ സ്വീകരിക്കപ്പെടുമെന്ന കാര്യത്തില് സന്ദേഹങ്ങള് ഉയരാന് കാരണം. ചിത്രങ്ങള് വെറും കമാന്ഡുകള് കൊണ്ട് നിര്മിക്കാം എന്നതടക്കമുള്ള നിരവധി ഗുണവശങ്ങള് ഉണ്ടെങ്കിലും വ്യാജ ചിത്രങ്ങള് നിര്മിച്ച് തട്ടിപ്പുകള് നടത്താമെന്ന പേടിയും നിലനില്ക്കുന്നു.
∙ ഡാല്-ഇ
വാക്കുകള് ഉപയോഗിച്ചു നല്കുന്ന വിവരണങ്ങള് മനസ്സിലാക്കി മികവുറ്റ ചിത്രങ്ങളും ആര്ട്ട് വർക്കുകളും മോഡലുകളുടെ യഥാര്ഥ ചിത്രങ്ങളെന്നു തോന്നിക്കത്തക്ക വിധത്തിലുള്ള ഫോട്ടോ റിയലിസ്റ്റിക് ചിത്രങ്ങളും നല്കാന് കെല്പ്പുള്ള ആര്ട്ടിഫിഷ്യൽ ഇന്റലിജന്സ് സംവിധാനം അവതരിപ്പിച്ചിരിക്കുകയാണ് ഓപ്പണ്എഐ (OpenAI) കമ്പനി. സാന്ഫ്രാന്സിസ്കോ കേന്ദ്രമായി പ്രവര്ത്തിക്കുന്ന ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് കമ്പനി നല്കുന്ന സേവനത്തിന്റെ പേരാണ് ഡാല്-ഇ 2 (DALL-E 2). എംഐടി ടെക്നോളജി റിവ്യൂ, പിസിമാഗ്, എന്പിആര് തുടങ്ങിയ വെബ്സൈറ്റുകളെല്ലാം ഇതിനെ പുകഴ്ത്തി രംഗത്തെത്തി. അടുത്തിടെവരെ, തിരഞ്ഞെടുക്കപ്പെട്ടവര്ക്കു മാത്രം ലഭ്യമായിരുന്ന ഡാല്-ഇ 2 ഇപ്പോള് പൊതുജനങ്ങള്ക്കുള്ള ബീറ്റാ പതിപ്പായി ഇറങ്ങിയിരിക്കുന്നു. നേരത്തേ ഉണ്ടായിരുന്ന ഡാല്-ഇ 1 നേക്കാള് മികച്ചതാണ് ഇപ്പോള് ഇറക്കിയിരിക്കുന്ന ഡാല്-ഇ2 എന്ന് ഇത് പരീക്ഷിച്ചവര് പറയുന്നു.
∙ അവിശ്വസനീയമായ മികവ്
അവിശ്വസനീയമായ രീതിയില് ശക്തിമത്താണ് ഇതെന്ന് യൂണിവേഴ്സിറ്റി ഓഫ് കലിഫോര്ണിയയിലെ ഡിജിറ്റല് ഫൊറന്സിക് വിദഗ്ധന് ഹാനി ഫാരിദ് പറഞ്ഞതായി എന്പിആര് റിപ്പോര്ട്ടു ചെയ്യുന്നു. നിങ്ങളുടെ ഭാവനയുടെ അഗാധ തലത്തിലുള്ള കാര്യങ്ങള് അറിഞ്ഞ് അതിനോട് അവിശ്വസനീയമായ രീതിയില് സാമ്യമുള്ള ചിത്രങ്ങളും മറ്റും നിർമിച്ചു നല്കാന് ഡാല്-ഇക്ക് സാധിക്കുന്നു എന്ന് അദ്ദേഹം സാക്ഷ്യപ്പെടുത്തുന്നു. ഡാല്-ഇയുടെ മികവു വര്ണ്ണിക്കുന്ന വിഡിയോ ഇവിടെ കാണാം: https://youtu.be/qTgPSKKjfVg
ഒരാളുടെ ഒരു ഫോട്ടോ നല്കിയാല്, അത് വീക്ഷണകോണില്നിന്ന് എടുത്താല് എങ്ങനെയിരിക്കുമോ അതൊക്കെ സൃഷ്ടിക്കാനും സാധിക്കും. ഇതും ദുരുപയോഗപ്പെട്ടേക്കാമെന്ന പേടിയും ഉണ്ട്. ന്യൂറല് ചിത്രങ്ങളും അവയുടെ വാക്കുകളിലുള്ള വിവരണങ്ങളും നല്കി പരിശീലിപ്പിച്ചെടുത്തതാണ് ഡാല്-ഇ സോഫ്റ്റ്വെയറിനെ. വിവിധ വസ്തുക്കളെ തിരിച്ചറിയാനുള്ള ശേഷി അതിനു ലഭിച്ചു കഴിഞ്ഞു.
ബഹിരാകാശ സഞ്ചാരികള് പട്ടികളുമൊത്ത് ഫുട്ബോള് കളിക്കുന്ന ചിത്രം എന്ന വിവരണം നല്കിയാല് അത് സാമാന്യം വിശ്വസനീയമായ രീതിയില് സൃഷ്ടിക്കാനുള്ള കഴിവ് ആര്ജിച്ചിരിക്കുകയാണ് ഡാല്-ഇ2. 'ടെഡി ബെയര് ശാസ്ത്രജ്ഞന്' രാസവസ്തുക്കള് സംയോജിപ്പിക്കുന്ന പടം എന്നു പറഞ്ഞാല് അതും സൃഷ്ടിച്ചു നല്കും. കുട്ടികള്ക്കുള്ള ചിത്രങ്ങള് നിറച്ച ഒരു പുസ്തകം ഇറക്കാനാഗ്രഹിക്കുന്ന ആളാണ് നിങ്ങളെങ്കില് ഇപ്പോള് കാര്യങ്ങളൊക്കെ എത്ര എളുപ്പമായെന്ന് ഒന്ന് ആലോചിച്ചു നോക്കൂ. അത് ഇലസ്ട്രേഷന്റെ കാര്യം. അതേസമയം, ഇല്ലാത്ത വ്യക്തികളുടെ ഫോട്ടോകൾ സൃഷ്ടിക്കാന് ഡാല്-ഇക്ക് സാധിക്കും.
∙ സ്റ്റേണ്
ഈ സോഫ്റ്റ്വെയര് പരീക്ഷിച്ചു നോക്കിയവരില് ഒരാളാണ് മതിയു സ്റ്റേണ് (Mathieu Stern) എന്ന ഫ്രഞ്ച് ഫൊട്ടോഗ്രഫര്. അദ്ദേഹം ഡാല്-ഇ വഴി സൃഷ്ടിച്ച മനുഷ്യരുടെ ചില ചിത്രങ്ങള് അത്യന്തം വികലമായിരുന്നു. ചിലത് മികച്ചതായിരുന്നു. പലതിന്റെയും കണ്ണുകള് അത്ര മികച്ച രീതിയിലല്ല സൃഷ്ടിച്ചിരിക്കുന്നത്. എന്നാല്, ഇത് ഫൊട്ടോഷോപ്പിലെ ന്യൂറല് ഫില്റ്ററുകള് ഉപയോഗിച്ച് മികവുറ്റതാക്കാമെന്ന് സ്റ്റേണ് പറയുന്നു. ഭാവിയില് കൂടുതല് മികവുറ്റ 'ഫോട്ടോ യാഥാര്ഥ്യ'ത്തോടു കൂടിയ ചിത്രങ്ങള് സൃഷ്ടിക്കാന് ഡാല്-ഇക്കു സാധിച്ചേക്കും. ഒരുപക്ഷേ, ഇങ്ങനെ സൃഷ്ടിച്ചെടുക്കുന്ന ചിത്രങ്ങള് ദുരുപയോഗം ചെയ്യപ്പെടാതിരിക്കാനുള്ള ഒരു മുന്കരുതല് കൂടിയാകാം കണ്ണുകളെ വൈകല്യമുള്ളവ ആക്കുന്നതെന്നും കരുതാം.
∙ പരിമിതികളും ഉണ്ട്
ഏതൊരു എഐയുടെ കാര്യത്തിലുമെന്നവണ്ണം ഡാല്-ഇയെ പരിശീലിപ്പിക്കാന് ഉപയോഗിക്കുന്ന മെറ്റീരിയലില് പിഴവു വന്നെങ്കില് അത് ഡാല്-ഇയുടെ പ്രകടനത്തിലും പ്രതിഫലിക്കും. അതേസമയം, നല്ല രീതിയിലാണ് പരിശീലിപ്പിച്ചിരിക്കുന്നതെങ്കില് അവിശ്വസനീയമായരീതിയില് മികവുറ്റ ചിത്രങ്ങളും നല്കും. ഇതുകണ്ടാണ് ടെക്നോളജി ലോകം ‘വാ പൊളിച്ചു’ നില്ക്കുന്നത്. ഇതിനാല് തന്നെ ഡാല്-ഇയുടെ പ്രവര്ത്തനവും പുരോഗതിയും നോക്കിയാല് ചില രീതികളില് എഐ എങ്ങനെ മുന്നേറുന്നു എന്ന കാര്യവും മനസ്സിലാക്കാം. മറ്റു ചിത്രങ്ങളും വിവരണങ്ങളും നല്കി പഠിപ്പിച്ചെടുത്ത കാര്യങ്ങള് പുതിയതായി സൃഷ്ടിക്കുന്ന ചിത്രത്തിലും പ്രയോജനപ്പെടുത്താന് സാധിക്കുമെന്നതും ഈ മേഖലയിലുള്ള വന് പുരോഗതി തെളിയിക്കുന്നു. ഉദാഹരണത്തിന് ഒരു കുരങ്ങന്റെ പടവും ഒരാള് നികുതി അടയ്ക്കുന്ന കാര്യവും പഠിപ്പിച്ചു നല്കിയ ശേഷം കുരങ്ങന് ഹാസ്യജനകമായ തൊപ്പി ധരിച്ച് ടാക്സ് അടയ്ക്കുന്ന ചിത്രം വേണമെന്നു പറഞ്ഞാല് അതിന് സൃഷ്ടിച്ചു നല്കാനാകും!
∙ ഡാല്-ഇ എന്ന പേര്
വിശ്വവിഖ്യാത കലാകാരന് സാല്വദോര് ഡാലിയുടെ പേരും പിക്സാര് സിനിമ വാള്-ഇ (WALL-E) എഴുതുന്ന രീതിയും യോജിപ്പിച്ചാണ് ഇതു സൃഷ്ടിച്ചിരിക്കുന്നതെന്ന് എന്പിആര് പറയുന്നു.
∙ ഭയപ്പെടുത്തുന്നത് എന്തുകൊണ്ട്?
ഒരു പ്രധാനമന്ത്രിയോ മറ്റേതെങ്കിലും പ്രശസ്തനോ വെടിയേറ്റുകിടക്കുന്ന ചിത്രം സൃഷ്ടിക്കാന് ആവശ്യപ്പെട്ടാല് ഡാല്-ഇ 2ന് അത് സൃഷ്ടിക്കാൻ സാധിച്ചേക്കും. ഇത്തരം ‘കെട്ടിച്ചമച്ച’ ചിത്രങ്ങള് കടുത്ത ആഘാതങ്ങള് തന്നെ സൃഷ്ടിച്ചേക്കാം. അല്ലെങ്കില് യുക്രെയ്ന് യുദ്ധത്തില് നടക്കാത്ത കാര്യങ്ങളെക്കുറിച്ചുള്ള കാര്യങ്ങള് സൃഷ്ടിച്ചെടുത്ത് സമൂഹ മാധ്യമങ്ങള് വഴി പ്രചരിപ്പിക്കുന്നതു സങ്കല്പ്പിച്ചു നോക്കൂ.
∙ ചിത്രങ്ങള് സൃഷ്ടിക്കുന്നതിന് ഊര്ജം വേണം
ഇങ്ങനെ കമാന്ഡിന് അനുസരിച്ച് ചിത്രങ്ങള് ഉണ്ടാക്കിയെടുക്കാന് കമ്പനിക്ക് ധാരാളം വൈദ്യുതി-കംപ്യൂട്ടിങ് ശക്തി വേണം. അടുത്ത ഘട്ടത്തില് 10 ലക്ഷം പേര്ക്ക് സേവനം നല്കാനാണ് ഓപ്പണ് എഐ ഉദ്ദേശിക്കുന്നത്. ഇത് കമ്പനിക്ക് താങ്ങാനാകുമോ എന്ന കാര്യത്തിലും സംശയമുണ്ട്. ഡാല്-ഇയുടെ വെയ്റ്റിങ് ലിസ്റ്റില് ചേരാന് ആഗ്രഹമുള്ളവര്ക്ക് ഈ ലിങ്ക് ഉപയോഗിക്കാം: https://labs.openai.com/waitlist
നിങ്ങള്ക്കു ക്ഷണം ലഭിച്ചാല് പബ്ലിക് ബീറ്റാ ടെസ്റ്റില് ചിത്രങ്ങള് സൃഷ്ടിച്ചെടുക്കാം. ആദ്യ മാസത്തില് 50 ചിത്രങ്ങള് ഫ്രീയായി സൃഷ്ടിക്കാം. പിന്നീടുള്ള മാസങ്ങളില് ഫ്രീ ഫോട്ടോകളുടെ എണ്ണം 15 ആയി കുറയും. ഓരോ തവണയും കമാന്ഡ് നല്കുമ്പോള് നാലു ചിത്രങ്ങള് വീതമാണ് നല്കുക. അതു പോരാത്തവര്ക്ക് 15 ഡോളര് നല്കിയാല് 115 ഇമേജുകള് സൃഷ്ടിച്ചെടുക്കാനുള്ള അവസരമാണ് കമ്പനി ഒരുക്കുന്നത്.
English Summary: OpenAI's DALL-E 2: A dream tool and existential threat to visual artists