ADVERTISEMENT

ലോകം എക്കാലവും വാഴ്ത്തിക്കൊണ്ടിരിക്കുന്ന ലിയനാർഡോ ഡാവിഞ്ചിയുടെ മഹത്തായ സൃഷ്ടിയാണ് മൊണാലിസ. നിഗൂഢതകളും രഹസ്യങ്ങളും ഒളിപ്പിച്ചുവയ്ക്കുന്ന മൊണാലിസയുടെ മുഖഭാവവും ചിരിയും ഏവരെയും എന്നും അദ്ഭുതപ്പെടുത്തിക്കൊണ്ടേയിരിക്കുന്നു. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അഥവാ നിർമിത ബുദ്ധിയുടെ സഹായത്തോടെ തയ്യാറാക്കിയ മൊണാലിസയാണ് സമൂഹമാധ്യമങ്ങളിൽ ഇപ്പോൾ തരംഗമായിക്കൊണ്ടിരിക്കുന്നത്. മൈക്രോസോഫ്റ്റിന്റെ ഔദ്യോഗിക എക്‌സ് പേജിൽ പോസ്റ്റ് ചെയ്തിരിക്കുന്ന ന്യൂജൻ റാപ് ആപലിക്കുന്ന മൊണാലിസയ്ക്ക് ഇതിനോടകം തന്നെ ഏഴു മില്യനിൽ അധികം കാഴ്ചക്കാരെ ലഭിച്ചുകഴിഞ്ഞു. മൈക്രോസോഫ്റ്റിന്റെ വാസാ-1 എന്ന എ.ഐ. ആപ്പ് ഉപയോഗിച്ചാണ് റാപ് ആപലിക്കുന്ന മൊണാലിസയെ സൃഷ്ടിച്ചിട്ടുള്ളത്.

മോണാലിസയും എഐയും 

1503നും 1506നും ഇടയിലാണ് മോണലിസയുടെ ചിത്രം ഡാവിഞ്ചി പൂർത്തിയാക്കിയതെന്ന് ചരിത്രാന്വേഷകർ പറയുന്നു. യഥാർത്ഥത്തിൽ അങ്ങനെയൊരു സ്ത്രീ ജീവിച്ചിരുന്നോ അതോ ഡാവിഞ്ചിയുടെ വെറും ഭാവന മാത്രമാണോ മൊണാലിസ എന്ന കാര്യത്തിൽ ഇന്നും ഒരു ഉത്തരം ആരും കണ്ടെത്തിയിട്ടില്ല. ചിത്രത്തിനു പിന്നിലുള്ള അന്വേഷണങ്ങൾ ഇന്നും തുടർന്നുകൊണ്ടേയിരിക്കുമ്പോഴാണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ സഹായത്തോടെ പാട്ടുപാടുന്ന മോണാലിസയെ തയ്യാറാക്കിയിരിക്കുന്നത്. മൈക്രോസോഫ്റ്റ് അവതരിപ്പിച്ച VASA-1 ആർട്ടിഫിഷ്യൽ ഇൻറലിജൻസ് (എ.ഐ.) മോഡൽ ഉപയോഗിച്ചാണ് ചിത്രത്തിന് ജീവൻ നൽകിയിരിക്കുന്നത്.

VASA-1

'തത്സമയം ജനറേറ്റു ചെയ്‌ത ലൈഫ് ലൈക്ക് ഓഡിയോ-ഡ്രവൺ ടോക്കിങ് ഫേസ്' നിർമിക്കുന്ന ഒരു AI മോഡൽ എന്നാണ് മൈക്രോസോഫ്റ്റ് VASA-1-നെ വിശേഷിപ്പിക്കുന്നത്. വിഷ്വൽ ഇഫെക്റ്റിവ് സ്കിൽ ആണ് 'VAS'.

എഐ ഇമേജ്-ടു-വിഡിയോ മോഡൽ

ഒരു ഫോട്ടോയും അത് സംസാരിക്കേണ്ട ഓഡിയോ ട്രാക്കും മാത്രമാണ് എഐ ഇമേജ്-ടു-വിഡിയോ മോഡൽ തയ്യാറാക്കാൻ ആവശ്യമുള്ളത്. ഒരാളുടെ ചിത്രം ഉപയോഗിച്ച് അയാളുടെ മുഖത്ത് പല ഭാവങ്ങൾ സൃഷ്ടിക്കുവാനും അതിൽ ചലനങ്ങൾ ഉണ്ടാക്കുവാനും VASA-1 ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (എഐ) മോഡലിലൂടെ സാധിക്കുന്നു. കണ്ണുകൾ ഉൾപ്പടെ മുഖത്തെ സൂക്ഷ്മ ചലനങ്ങൾ പോലും സമന്വയിപ്പിച്ചാണ് വിഡിയോകൾ സൃഷ്ടിക്കപ്പെടുന്നത്. ഓഡിയോയുമായി ചേർന്നു നിൽക്കുന്ന ചുണ്ടുകളുടെ ചലനങ്ങൾ പോലും അനിമേഷനുകളിലൂടെ എഐ ആപ്പിലൂടെ ഒരുക്കാൻ കഴിയുന്നു. ഭാവപ്രകടനങ്ങൾ കൊണ്ട് യഥർഥമാണ് എന്നു തോന്നിപ്പിക്കുന്ന വിധത്തിലുള്ള വിഡിയോകളും നിമിഷനേരം കൊണ്ട് ഈ ആപ്പുകൾ ഉപയോഗിച്ച് തയ്യാറാക്കാൻ കഴിയുന്നു. വെറും ചിത്രങ്ങൾ മാത്രം ഉപയോഗിച്ച് തയ്യാറാക്കിയ നിരവധി പ്രമുഖരുടെ വിഡിയോകൾ ഇതിനകം വൈറൽ ആയിരുന്നു. 

VASA 1 ഉം മറ്റു മോഡലുകളും 

എഐ കമ്പനിയായ റൺവേ, എൻവിഡിയയുടെ ഓഡിയോ 2 ഫേസ് എഐ ആപ്ലിക്കേഷൻ, ഗൂഗിളിന്റെ വ്ലോഗർ എഐ, ഇമോ എഐ എന്നിവയും സമാനമായി വിഡിയോകൾ തയ്യാറാക്കാൻ ഉപയോഗിക്കാറുണ്ട്. ദൈർഘ്യമുള്ള ഓഡിയോ ക്ലിപ്പുകളും ഉപയോഗിക്കാം എന്നതാണു മറ്റ് മോഡലുകളിൽ നിന്നും VASA 1 നെ വ്യത്യസ്തമാക്കുന്നത്. ഒപ്പം മുഖചലനങ്ങളിൽ കൃത്യമായ സൂക്ഷ്മത ഉറപ്പുവരുത്തുവാനും കഴിയുന്നുണ്ടെന്നുമാണ് മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ എഐ മോഡലിനെക്കുറിച്ചു പറയുന്നത്. ഓഫ്‌ലൈൻ പ്രോസസിങ് മോഡിൽ, മോഡലിന് 512x512 വലുപ്പത്തിലുള്ള വിഡിയോ ഫ്രെയിമുകൾ സെക്കൻഡിൽ 45 ഫ്രെയിമുകൾ സൃഷ്ടിക്കാൻ കഴിയും. ഓൺലൈൻ സ്ട്രീമിങ് മോഡിൽ, ഇതിന് 170 മില്ലിസെക്കൻഡ് മുമ്പുള്ള ലേറ്റൻസിയിൽ സെക്കൻഡിൽ 40 ഫ്രെയിമുകൾ വരെ തയ്യാറാക്കാനും കഴിയുമെന്ന് മൈക്രോസോഫ്റ്റ് ഉറപ്പു നൽകുന്നു.

ആശങ്കകളും ആശ്വാസങ്ങളും

എഐ യുഗത്തിലൂടെയാണ് നാമിപ്പോൾ സഞ്ചരിക്കുന്നത്. ഒരിക്കലും നടക്കില്ലെന്നു കരുതിയിരുന്ന ഒട്ടേറെ കാര്യങ്ങളെ പുനഃസൃഷ്ടിക്കുവാൻ ഈ  എഐ യുഗത്തിൽ കഴിയുന്നുണ്ട്. പുത്തൻ അപ്ഡേഷനുകൾ വരുമ്പോൾ പുത്തൻ കണ്ടുപിടുത്തങ്ങളും സംഭവിക്കപ്പെടുന്നു. ഒപ്പം ഒട്ടേറേ ദുരുപയോഗങ്ങളും നടന്നേക്കാമെന്ന ആശങ്കകളും. വളരെയധികം ദുരുപയോഗങ്ങൾക്കിടയാക്കുന്ന ഡീപ്ഫേക്കുകളെ സൃഷ്ടിക്കാൻ VASA-1 ഉപയോഗിക്കപ്പെട്ടേക്കാം എന്ന ആശങ്ക ഉയരുന്നുണ്ട്. ഗവേഷണ ഘട്ടങ്ങളിലൂടെ കടന്നുപോകുന്നതിനാൽ തന്നെ അത്തരം ദുരുപയോഗങ്ങളെ തടയാനുള്ള മാർഗങ്ങൾ സ്വീകരിക്കുമെന്ന് മൈക്രോസോഫ്റ്റും ആശങ്കകൾക്കുള്ള മറുപടിയായി അറിയിക്കുന്നുണ്ട്. ഗുണകരമായ ഒട്ടേറെ കാര്യങ്ങൾക്കുവേണ്ടിയാണ് തങ്ങൾ VASA 1 ലൂടെ ലക്ഷ്യമിടുന്നതെന്നും മൈക്രോസോഫ്റ്റ് പറയുന്നു.

English Summary:

Mona Lisa singing AI Video goes viral-MKID

ഇവിടെ പോസ്റ്റു ചെയ്യുന്ന അഭിപ്രായങ്ങൾ മലയാള മനോരമയുടേതല്ല. അഭിപ്രായങ്ങളുടെ പൂർണ ഉത്തരവാദിത്തം രചയിതാവിനായിരിക്കും. കേന്ദ്ര സർക്കാരിന്റെ ഐടി നയപ്രകാരം വ്യക്തി, സമുദായം, മതം, രാജ്യം എന്നിവയ്ക്കെതിരായി അധിക്ഷേപങ്ങളും അശ്ലീല പദപ്രയോഗങ്ങളും നടത്തുന്നത് ശിക്ഷാർഹമായ കുറ്റമാണ്. ഇത്തരം അഭിപ്രായ പ്രകടനത്തിന് നിയമനടപടി കൈക്കൊള്ളുന്നതാണ്.
തൽസമയ വാർത്തകൾക്ക് മലയാള മനോരമ മൊബൈൽ ആപ് ഡൗൺലോഡ് ചെയ്യൂ
അവശ്യസേവനങ്ങൾ കണ്ടെത്താനും ഹോം ഡെലിവറി  ലഭിക്കാനും സന്ദർശിക്കു www.quickerala.com