텍스트 받아쓰기 3종 비교 (Voice to text): 아이폰 키보드 받아쓰기, 클로바노트, gpt 엔진
서론 및 주의사항
안녕하세요. 자잘자잘IT입니다. 이번 포스팅에서는 제가 사용하는 받아쓰기 서비스를 종합적으로 비교해 보겠습니다. 비교군은 총 3개입니다.
\1. 아이폰 받아쓰기
\2. 네이버 클로바노트
\3. GPT엔진 입니다.
아래는 직접 작성한 메모 샘플입니다. 각각의 앱 또는 서비스를 사용해 메모한 것으로 개인 메모를 위해 작성한 것이다 보니 반말로 작성 되어 있는 점 이해 부탁드리며, 찾으시는 분들이 많으시면 똑같은 오디오 파일을 여러 엔진에 테스트 보는 것도 포스팅으로 남겨 보겠습니다. 그럼 바로 시작하겠습니다.
아이폰
(특수문자는 직접 말하거나 키보드로 입력)
iPhone 받아쓰기는 텍스트필드만 있으면 언제 어디서든 쓸 수 있다는 점. 정확도는 최악이고 한글에서는 특히나 띄어쓰기 같은 게 별로야. '쉼표, 마침표, 슬래시 등 특수 문자들은 전부다 말로 해야 돼. 만약에 .를 글에 삽입하고 싶으면 ’마 침 표‘ 라고 말해야 돼. 여간 불편한 게 아니다. 그리고 진짜 어지간히 못 알아 듣는 단어들이 있어. 전부다 나락이나 어려운데 ‘글에’라는 낱말은 곧 죽어도 그래 라고 받아들여. 붙여넣기 옵션을 사용할때 라는 문장을 부천 오키 옵션으로 받아쓰는 건 좀 심하잖아.
클로바 노트
확실히 한글 받아쓰기는 클로바 노트가 최적화되어 있는 것 같아.
뭐 띄어쓰기나 이런 거는 다른 엔진들도 충분히 좋기는 한데 뭐랄까 네이버만의 맞춤법 검사 기능이라고 해야 되나 그런 게 여기에도 들어가지 않았을까라는 합리적인 의심을 해보는 편이기도 해.
내용이 변하는 것 같거나 그럴 때 출바꿈도 잘해주고 단락도 잘 바꿔주고 공백도 잘 만들어주고 그런 부분에서는 확실히 좋아지고 있는 것 같아.
사실 처음에는 되게 별로였어. 당연한 얘기긴 한데 처음에는 막 문장 중간에 끊겨 있고 막 이 문장 여기저기 가 있다 저기 가 있다.
막 그렇기도 했었는데 개인적인 메모를 하는 용도에 있어서는 이제 부족할 게 하나도 없다고 생각해.
그런데 단점이 하나 있다면 서버에 업로드 되고 그게 변환되는 과정이다 보니까 시간이 꽤나 오래 걸려.
또 하나 단점 있다면 붙여넣기 옵션이 까다로워 전체 노트, 녹음 내용을 공유하려면 음성 기록을 선택하고 그 외에 건 드려야 될 기본 설정들이 좀 있어. 거기에다가 마음대로 제목 시간 음성 길이 클로버 노트 링크 등등이 복사 붙여넣기 돼. 개인적으로 사용 하기 보다는 강의록, 회의록, 통화 내용 녹음 등에 사용하기 적합한 거 같애.
GPT 엔진
GPT-3에서도 마이크의 모델이라고 해야되나? 음성을 텍스트로 바꿔주는 기능이라고 해야되나? 그런거는 제일 확실한거같아. 그리고 다른 무엇보다 한글만 쓸게 아니라 다른 언어를 쓸거면 얘가 제일 편해 은근히 영어를 사용하는 사람들이 많잖아 근데 영어로 받아쓰기를 하려면 일단 아이폰 키보드에서는 반드시 입력 언어 바꿔줘야 되고 네이버는 한국어 플러스 영어 이런 식으로 하면은 크게 상관이 없기는 해 둘 다 잘 받아들이는 편이긴 해 그런데 OpenAI는 그냥 영어로 말하면 그때부터 영어로 받아 적어 받아쓰기 하는 게 그 부분에서 엄청 정확해 갑자기 스페인어를 해도 스페인어로 답하고 갑자기 독일어를 해도 독일어로 답하고 사실 스페인어나 독일어나 중국어나 이런 건 안 해봐서 모르긴 하겠는데 적어도 문장을 한국어 문장을 쓰다가 영어로 바꿔서 얘기를 해도 문제없이 곧바로 인식해서 답변하고 온 것 같아
결론
한글을 사용 한다면 클로바 노트가 확실히 가장 정확했습니다. 하지만 오디오 녹음을 따로 해야 한다는 점, 업로드와 변환을 위해서는 앱을 켜 놓는 것이 안정적이라는 단점이 있습니다.
반면 iPhone 받아쓰기는 한국어 띄어쓰기 능력이 특히나 많이 떨어진다는 인상을 받았습니다.
여러분들의 경험은 어떠신가요? 개인의 발음이나 억양에 따라서 결과가 달라질 수도 있기 때문에, 이 포스팅은 재미로만 봐 주시면 감사하겠습니다.