[promptStrategies TIPs Series #14] 이미지 생성에서 부정어는 안먹힐까? (ChatGPT)
ChatGPT의 이미지 생성기능을 활용해서 (DALL-E) 이미지를 생성하는 것은 재미도 있고 디지털 마케팅에서 블로그나 이메일 용 이미지를 만드는 등 구체적인 업무용도로 사용할 때 매우 유용하기도 하다. 그러나, 프롬프트를 원하는 이미지가 그대로 나오도록 하는 작업은 분명 어려운 일이다. 적어도 아직까지는. 시킨대로 하지 않기도 하고, 세부사항을 정확히 지시하기가 매우 힘들고 길어지고, 복잡하기도 하고.
흔히들 "부정어를 사용해도 전혀 인식하지 못한다"고 이미지 생성 관련 프롬프트 사용 관련해서 알고들 있다. 거의 정설처럼 받아들여지는 느낌이다. 그런데, 진짜 그렇다면 ChatGPT와 DALL-E를 만든 사람들이 그걸 몰라서 그대로 두고 있는 걸까? 그래도 상관없어서? 선뜻 납득이 되지 않는다.
그렇다면, 테스트를 해보자. "NO"를 알아듣는지, 시킨대로 하는지.
신발없이라고 했더니 신발이 없다. 사람이 신발을 신지 않았다는 의미를 그대로 구현한 셈이다.
자동차에 문이 없는 상태로 만들어졌고, 다음 이미지에서는 전장에서 군인이 헬멧을 안쓴 상태다.
억지로 이상할 수 있지만 테스트 삼아서.... 대머리 여가수 대신 "머리가 없는" 으로 해봤다.
물론, 부정어를 못알아듣는 경우가 매우 자주 있는 것이 사실이다. "날개없이 날아가는 비행기" 같은 경우 해보니 날개를 달고 있었고 날개 없는 것을 그렸다고 주장한다. 맥락과 관련이 있는 것 같다는 추측도 든다. 하지만, 시도 조차 하지 않은 것은 아니라는 생각이 든다.
한편, 앞 선 예들은 프롬프트에 처음부터 영어로만 해본 경우들이었지만,
영어로된 프롬프트에서만 "no" 가 통할까? 한국어로 하는 경우라면?
포크는 테이블 옆에 있고, 손에 무언가를 쥐고는 있으나 포크는 아닌 것 같다. 시킨대로 하지 않았다고 보기 어렵다. 한글이라고 해서 안통하지는 않았다.
Recap ::
한국어와 영어 모두에서 부정어(No, without 등 과 같은) 들이 작동된다. 물론 ChatGPT와 Dall-e가 지시를 따르지 않기도 하고 따르지 않았으면서 따랐다고 잘못된 주장을 하는 경우도 "매우 자주" 있지만, 부정어가 전혀 쓸모 없는 것은 분명 아닌 것 같다. 부정을 나타내는 다른 표현을 억지로 찾아내기가 어렵다면 우선 자연스럽게 부정어를 사용해서 몇 가지 시도해 본 후 잘 안되면 우회적인 표현들 (hairless, doreless, ... ) 고쳐보는 것이 현실적일 것이다.
Note ::
이 글은 "디지털 마케터의 챗GPT 활용 전략" 책을 보강 Update하기 위한 내용입니다. 책에 대한 소개는 다음을 참고하세요
https://revisioncrm.tistory.com/596
관련 포스트 (이미지 생성) ::
https://revisioncrm.tistory.com/613
https://revisioncrm.tistory.com/634
'인공지능' 카테고리의 다른 글
ChatGPT가 주도하는 AI 시대 - 관심추이 5 Fact 분석 (0) | 2024.02.19 |
---|---|
고급 AI 비디오 생성 모델 Sora의 기능과 디지털 마케팅 활용 방안 (0) | 2024.02.16 |
K-pop 시장 최근 트렌드 조사 w ChatGPT (0) | 2024.02.14 |
thick paint painting style in dall-e3 (0) | 2024.02.13 |
[promptStrategies TIPs Series #13] 쪼개야 보인다? - 시장 조사 w ChatGPT (1) | 2024.02.13 |