アップルの研究者らが、カリフォルニア大学サンタバーバラ校の研究者と協力して開発した画像生成AI「MLLM-Guided Image Editing (MGIE)」を2月5日に発表していました。
「MGIE」はテキストによる命令文を理解して画像を編集するAIで、「画像生成AI」というよりも「画像編集AI」といった感じのAIですが、ともかくアップル製の画像生成AIです。
「MGIE」は、オープンソースバージョンが「GitHub」で公開されています。
が、ギフハブ? 謎の組織か? みたいによく分からない人が大半だと思われますので、そういう人のためにAIプラットフォーム「Hugging Face」でデモバージョンが利用できるようになってます。
「MGIE」、実際に使ってみた
というわけで早速「MGIE」を使ってみました。
こちらのマックスむらいの写真を読み込ませて、「サングラスをかけさせて」と命令してみました。
その結果がこちら。
……うーん、サン、、、グラス?
なんかテキトーに黒で塗りつぶしたというか、青い眉毛も生えてるしでだいぶやっつけ感があります。
これだけではアレですので、今度は「メガネを外して」と命令してみました。
その結果がこちら。
……こわ! マックスむらいこわ!
宇宙人みたいになってるし、パーカーのマックスむらいロゴも消えています。
こいつはマックスむらいじゃない! 別の何かだ!!!
「Hugging Face」のデモは以下のページから利用できます。
MLLM-guided Image Editing (MGIE) – a Hugging Face Space by tsujuifu