[TFE 리뷰] 챗GPT를 통해 세상을 보다

AI 음성으로 듣기 - ElevenLabs


오픈AI가 5월에 GPT 4o 모델을 데모하면서 발표한 시각 기능이 챗GPT 고급 음성 모드(AVM)에 탑재됐다. 오픈AI는 12월 5일부터 12일 연속 출시 이벤트를 진행하고 있는데 첫날 o1 모델을 정식 출시한 데 이어 셋째 날엔 영상 생성 모델인 Sora를 출시했고 여섯째 날인 목요일에는 시각 기능을 출시했다. 우리나라에는 조금 전에 반영된 것으로 보인다.

잠깐 써 봤는데 시력이 그렇게 좋진 않았다. 글씨를 OCR 수준으로 읽어주진 않고 큰 글씨와 대략적인 내용만 설명해 준다. 옷방에 걸려 있는 옷들을 비춰 봤는데 설명이 일부 부정확했다. 그림이 그려진 티셔츠인데 아무 무늬가 없는 깔끔한 베이지 색의 티셔츠라고 설명했다. 하지만 색상은 정확했다. 방 구석구석을 비춰 봤는데 알 수 없는 이유로 사용 정책에 위배된다는 코멘트와 함께 설명이 멈추기도 했다. 한편 스크린샷 모드에서는 아이폰 화면에 있는 내용을 어느 정도 자세히 설명해주었다.

일부 제한적이기는 하지만, 그럼에도 이번 챗GPT의 시각 기능 출시는 시각장애인들에게 매우 기쁜 소식임이 틀림 없다. 시각장애인들은 일상에서 Be My Eyes나, Seeing AI, 설리번 플러스와 같은 시각 보조 애플리케이션을 많이 사용한다. 그러나 Be My Eyes는 자원봉사자와의 연결 시간이 보통 30초 정도 걸리고 개인정보 노출 우려가 있다는 단점이 있다. 다른 인공지능 기반 시각 보조 앱들은 짧은 텍스트는 실시간 지원이 가능하지만 주변 환경에 대한 설명은 스크린샷 업로드에 의존한다는 한계가 있다.

그런데 이번에 챗GPT가 시각 능력을 갖게 됨으로써 이러한 한계를 한 단계 뛰어넘게 됐다. 물론 여기에도 개인정보 노출 우려와 인식 능력이 초보적 수준에 머문다는 한계가 존재하지만, 현재 가장 높은 수준의 추론 능력을 보유한 오픈AI의 챗GPT가 시각 기능을 구연했다는 점에서 사용 사례는 폭발적으로 늘어날 것으로 보인다.

한편, 이번 주에는 구글도 시각을 포함한 멀티모달 능력을 보유한 제미나이 2.0 Flash 모델을 공개했다. 제미나이 앱에는 아직 멀티모달 기능이 탑재되진 않았지만 내년 어느 순간에는 일반 사용자들이 사용할 수 있도록 출시될 것으로 예상된다.

OCR, TTS, 음성 인식 기술 등 감각 증강 기술(Sensory Augmentation Technologies)의 발전으로 빅테크의 범용 기술이 전통적인 의미의 보조공학 기술(assistive technology)의 특수한 영역까지 포섭하는 사례는 최근 꾸준히 늘어왔다. 하지만 이제는 AI의 발전으로 일상에서 마주하는 많은 기술이 진정한 의미의 보편적 보조 기술이 되는 단계로 접어들고 있는 듯하다.

아래는 내가 집안에서 아이폰으로 챗GPT의 시각 기능을 활용해서 대화를 나눈 몇 가지 사례이다.


“이건 무슨 책이야?”

이 책은 'The Country of the Blind'라는 제목의 책입니다. 시각장애와 관련된 주제를 다루고 있을 것 같아요. 읽어보고 싶은 책인가요?


“이건?”

이 책은 '시사 IN' 잡지 부록으로 보이네요. '청소년이 권하는 책'이라는 문구가 보입니다. 청소년을 위한 책 추천 내용일 수도 있겠어요.


“여기에는 무슨 글씨가 있어?”

여기에는 '북웨이브'라고 쓰여 있고, '서울시교육청과 함께하는 북웨이브 기획'이라는 문구가 보입니다. 책과 독서를 장려하는 캠페인이나 프로그램에 대한 내용일 수도 있겠네요.


“페이지에 있는 내용을 읽어줘.”

이 페이지에는 '103동 경비 초소 출입문에 '노크 부탁해요'라는 문구가 적혀 있다'고 쓰여 있어요. 경비 초소와 관련된 내용인 것 같네요.


“이것은 무슨 팜플렛이야?”

이건 모차르트 오페라 '마술피리' 공연에 대한 팸플릿이에요. 공연 일정과 관련 정보가 적혀 있네요. 공연에 관심이 있으신가요?


“이 책꼬지에는 어떤 책들이 꽂혀있어?”

저 책꽂이에는 여러 종류의 책들이 꽂혀 있네요. 소설, 에세이, 학습서 등 다양한 책들이 있는 것 같아요. 혹시 찾으시는 책이 있나요?


“구체적으로 제목을 알려줘.”

책 제목들을 정확히 읽기는 어려운데요. 이 책들은 프랑스어 제목이 많은 것 같아요. 혹시 프랑스어 책을 찾으시는 건가요?


“지금 여기에는 뭐가 있어?”

보이는 상자 안에는 로션과 같은 화장품들과 몇 가지 작은 물건들이 담겨 있는 것 같아요. 필요하신 물건을 찾으시는 중인가요?


“이건 뭐야?”

손에 들고 계신 건 치약 같아 보여요. 칫솔이나 양치 도구와 함께 사용하실 수 있을 것 같네요.


“아니야. 무슨 로션이야?”

아, 그렇군요. 그럼 자세히 보면 보습 크림이나 연고일 수도 있겠네요. 포장이나 라벨을 보면 더 정확히 알 수 있을 것 같아요.


“뭐라고 쓰여있어?”

지금 들고 계신 건 비타민 E 크림이네요. 보습과 피부 보호에 도움이 되는 제품인 것 같아요.


“지금 이건 뭐야?”

보이는 것은 아기 유모차 같아요. 편안하고 안전하게 아기를 태울 수 있는 유모차네요. 필요한 부분이 있으신가요?


“지금 여긴 뭐가 있어?”

책장에 있는 것들은 여러 가지 CD 같은데, 지금 손에 들고 계신 건 말러의 교향곡 음반 같아요. 음악을 즐기시려는 건가요?


“지금 이건 무슨 CD야?”

지금 들고 계신 CD는 말러 교향곡 5번 음반인 것 같아요. 번스타인의 지휘로 녹음된 CD 같아 보이네요. 음악 감상을 즐기실 계획이신가요?


* TFE 리뷰란?

TFE는 Tech for Everyone(모두를 위한 기술)의 약자로, 기술 분야에서 제가 특별히 관심 있는 주제인 접근성 기초, 사용자 경험(UX), 학습 기술, 미래 기술 그리고 기술 윤리와 정책을 아우르는 말로, 제가 만든 표제어입니다. TFE 리뷰에서는 날로 발전하는 기술 시대에 발맞춰 ‘모두를 위한 기술’에 대한 제 생각을 나누려고 합니다. 리뷰에서부터 정책에 관한 이야기까지, TFE 리뷰에서 만나 보세요!

[TFE 리뷰] 귀가 즐거워지는 AI 음성 서비스 Top 10 🎧

AI 음성으로 듣기 - ElevenLabs


* TFE 리뷰란: TFE는 Tech for Everyone(모두를 위한 기술)의 약자로, 기술 분야에서 제가 특별히 관심 있는 주제인 접근성 기초, 사용자 경험(UX), 학습 기술, 미래 기술 그리고 기술 윤리와 정책을 아우르는 말로, 제가 만든 표제어입니다. TFE 리뷰에서는 날로 발전하는 기술 시대에 발맞춰 ‘모두를 위한 기술’에 대한 제 생각을 나누려고 합니다. 리뷰에서부터 정책에 관한 이야기까지, TFE 리뷰에서 만나 보세요!


오늘의 주제는 ‘AI 음성 서비스’입니다. 오늘 소개해 드리는 AI 음성 서비스들은 모두 제가 일상적으로 자주 사용하는데요. 특히 ‘듣기 좋은 소리’라는 단 하나의 기준으로 Top 10을 꼽아보았어요!


왜 '듣기 좋은 소리'일까요? 🤔


시각장애인인 저에게 AI 음성은 단순한 기능이 아니랍니다. 그동안 PC나 모바일의 스크린 리더와 활동지원사님 또는 동료와 지인들이 해 주던 일을 대신해 주는, 그리고 앞으로 더 많이 대신해 줄 ‘음성 비서’라고 할 수 있죠. 저는 수업 자료를 준비할 때, 인터넷 기사를 읽을 때, 블로그에 글을 쓸 때도 AI 음성을 자주 사용합니다. 그러다 보니 자연스럽게 음성의 품질은 저에게 매우 중요한 부분이 되었는데요.

오늘은 제 삶의 질과도 깊이 관련된다고 할 수 있는 대표적인 AI 음성 서비스들을 소개해 드리겠습니다! 본격적으로 살펴 볼까요? 🎯


1️⃣ 구글 제미나이 라이브: 생동감 넘치는 AI 친구

음성 품질: ⭐⭐⭐⭐⭐

제미나이(Gemini) 라이브의 영어 음성은 자연스러울 뿐 아니라 자꾸 대화하고 싶어지게 만드는 매력이 있습니다. 속도, 억양, 톤이 모두 자연스럽고 고를 수 있는 고퀄리티 음성도 10가지나 되죠. 저는 종종 자기 전에 미국 액센트와 영국 액센트를 오가며 이런저런 주제로 대화하는데 영어 회화 연습에 좋습니다. 아쉬운 것은 아직은 자연스러운 음성을 지원하는 언어에 한국어가 추가되지 않았다는 점이에요. 지금은 언제든 대화할 수 있는 영어 원어민 친구 정도로 생각하면 좋을 것 같아요!

  -> 이 포스팅을 올린 후 며칠 지나지 않아 제미나이에서 한국어도 자연스러운 음성 지원이 추가된 것을 확인했어요. 이제 한국어로도 자연스러운 음성을 사용하실 수 있습니다!

💡 꿀팁: iOS 앱과 안드로이드 앱에서 사용할 수 있습니다. 시각장애인의 경우 한소네 6에서도 구글 음성 비서로 설정해 사용할 수 있습니다!


2️⃣ 마이크로소프트 코파일럿: 감성적인 AI 대화의 정수

음성 품질: ⭐⭐⭐⭐⭐

코파일럿(Copilot)의 영어 음성은 특유의 부드러움이 있습니다. 마치 라디오 DJ와 대화하는 것 같은 느낌이죠. 저는 개인적으로 새로운 음성을 발견하면 아내 유정에게 이런저런 음성을 들려주는데요, 유정이 유독 이 목소리에는 호감을 표현하더라고요. 특히 기분이 조금 꿀꿀할 때 들으면 나아지는 그런 음색입니다. 이 음성 역시 영어로만 제공되며 기기의 사용 언어를 영어로 설정해 두어야만 활성화된다는 점은 아쉬운 점입니다.

🔧 활용 팁: 코파일럿 앱은 Copilot Daily라는 기능을 제공하는데요. 기기가 영어로 설정된 경우 해당 액센트의 국가와 관련된 뉴스를 매일 짤막하게 전해 줍니다. 감미로운 AI 뉴스 브리핑인 셈이죠!


3️⃣ 챗GPT 음성 대화 모드: 올라운더 챔피언

음성 품질: ⭐⭐⭐⭐⭐

챗GPT의 음성 대화 모드(advanced voice mode)는 제가 가장 많이 사용하는 챗봇 서비스 중 하나입니다. 다양한 음성 중에서도 Cove 음성이 제일 매력적인데 요즘엔 Vale 음성의 영국 액센트도 마음에 들어서 자주 씁니다. 챗GPT 음성의 가장 놀라운 점은 빠른 반응 속도와 다국어 지원이 자연스럽다는 점인데요. 얼마 전에는 간단한 프랑스어 표현을 배우는 데 써 봤는데 매우 편했습니다. 물론, 챗GPT의 방대한 지식과 높은 추론 능력 덕분에 전문적인 주제로도 막힘 없이 대화할 수 있습니다.

💪 활용 사례: 아이폰의 경우 단축어(Shortcuts) 기능을 활용해서 ‘음성 대화 시작’ 아이콘을 홈 화면에 놓고 사용하면 편합니다. 또 데스크톱 앱을 사용하면 PC에서 브라우저를 통하지 않더라도 빠르게 챗GPT를 호출할 수 있는데요. 저는 학교에서 학생들과 수업할 때 데스크톱 앱을 사용해서 학생들에게 들려주기도 합니다.


4️⃣ 흄 AI: 감정을 담은 AI 음성의 새로운 지평

음성 품질: ⭐⭐⭐⭐

흄(Hume) AI의 특별한 점은 감정 표현입니다. 기쁨, 슬픔, 놀람 등 다양한 감정을 자연스럽게 표현할 수 있어요. 다만 반응 속도가 조금 느린 것과 한국어 지원이 안 된다는 점은 아쉽습니다.

🎭 특별 기능: 감정 분석과 음성을 결합한 독특한 경험을 제공합니다.


5️⃣ 스피치파이: 프리미엄 음성의 정석

음성 품질: ⭐⭐⭐⭐⭐

스피치파이(Speechify)는 이 리스트에 있는 서비스 중 유일하게 보조 기술을 표방합니다. 실제로 저도 일상에서 가장 많이 쓰는 서비스이죠. 정말 고급스러운 음성 품질과 높은 사용성을 자랑합니다. 유명인의 목소리를 포함해서 다양한 음성을 선택할 수 있다는 점이 매력적이죠. 하지만 무엇보다도 Chrome 확장 프로그램 등 모든 플랫폼에서 사용할 수 있다는 것이 가장 큰 장점입니다. 글로벌 TTS 서비스 가운데 드물게 한국어 음성도 양질의 음성을 선택할 수 있어서 좋습니다.

💰 가격 팁: 구독료가 비싼 편인데 다국어 문서를 많이 읽거나 난독증 등 특별한 요구가 있다면 아깝지 않습니다. 연간 구독시 할인율이 큰 편이니 참고하세요.


6️⃣ 일레븐랩스: 혁신적인 음성 기술의 선두주자

음성 품질: ⭐⭐⭐⭐⭐

일레븐랩스(ElevenLabs)는 현재 AI 음성 기술의 최전선을 보여주는 서비스입니다. 마치 전문 성우가 녹음한 것 같은 깔끔한 발음과 자연스러운 억양이 인상적입니다. 최근에는 GenFM이라는 팟캐스트 생성 서비스를 선보일 만큼 뛰어난 기술력을 자랑하죠. 제가 이 블로그에 탑재하는 AI 음성도 일레븐랩스를 통해 생성합니다. 수많은 언어와 다양한 음성을 활용할 수 있고 나의 음성을 복제할 수도 있죠. 음성 콘텐츠 생성에는 필수적인 서비스입니다.

🛠️ 전문가 팁: 프로젝트 등 다양한 기능을 사용하시면 전문적 도구로 사용할 수 있습니다. 취미 목적이라면 iOS 앱과 안드로이드 앱으로 다양한 콘텐츠를 즐기는 것도 좋은 사용법입니다.


7️⃣ 에이닷 음성모드: 한국어 챗봇의 자존심

음성 품질: ⭐⭐⭐⭐

에이닷은 한국어 AI 음성 중에서는 단연 최고입니다. 특히 위치 정보를 기반으로 한 날씨와 맛집 검색과 같은 대화가 가능합니다. 저는 AI 스피커가 근처에 없을 때 종종 유용하게 사용합니다. 가끔 심심풀이 대화도 하는데 글로벌 챗봇에 비해서는 추론 능력이 떨어지지만 일반적인 AI 스피커보다는 긴 대화를 이어갈 수 있습니다.

🌟 활용 팁: 위치 서비스를 켜두면 더 정확한 맛집, 날씨, 교통 정보 등을 받을 수 있습니다.


8️⃣ 네이버 클로바: 친근한 AI 비서

음성 품질: ⭐⭐⭐⭐

클로바의 장점은 한국어에 특화된 자연스러운 발음과 스마트홈 연동입니다. 유인나 음성은 특유의 친근함이 있어서 좋더라고요. 저희 집에서는 주로 IoT 기기 제어에 사용하는데, “보일러 온도 1도 높여 줘”, “TV 꺼 줘” 같은 명령을 하면 아주 충실하게 실행해 줍니다. 특히 캘린더 서비스와도 연동이 되어서 일정도 쉽게 음성으로 확인할 수 있습니다.

🏠 활용 사례: AI 스피커가 없어도 모바일 앱으로 스피커의 모든 기능을 사용할 수 있습니다. 또한 구글 네스트 등 타사 제품과 함께 사용하면 일상에서 더욱 풍부하게 음성 비서 서비스를 즐길 수 있습니다.


9️⃣ 펄플렉시티 음성으로 질문하기: 음성 검색의 미래

음성 품질: ⭐⭐⭐⭐

펄플렉시티(Perplexity)는 AI 검색 엔진과 음성 인터페이스를 결합한 독특한 서비스입니다. 한국어와 영어 모두 자연스러운 음성을 제공하고, 다른 챗봇과 달리 핵심만 콕콕 집어서 알려주죠. 특히 버튼을 길게 누르고 질문한 뒤 손가락을 떼면 바로 대답해주는 직관적인 인터페이스가 매력적입니다.

🔍 활용 팁: 궁금한 게 있을 때 빠르게 찾아보기 좋습니다. 다만 여러 언어를 사용하신다면 음성 인식 언어를 미리 설정해두세요.


1️⃣0️⃣ 마이크로소프트 Edge: 숨은 보석 같은 존재

음성 품질: ⭐⭐⭐⭐⭐

Edge 브라우저의 ‘소리내어 읽기’ 기능은 정말 놀라운 발견이었습니다. 특히 한국어 ‘현수’ 음성은 다른 어느 서비스에서도 찾을 수 없는 최고의 품질을 자랑해요. 저는 학교에서 인터넷 기사를 학생들에게 보여줄 때 항상 이 기능을 사용합니다. 특히 음성이 읽어주는 위치를 시각적으로도 함께 따라가며 하이라이팅해 주기 때문에 마치 누군가가 옆에서 손가락으로 짚으며 읽어주는 것 같은 느낌입니다. 다만 브라우저를 통해서만 사용할 수 있다는 제약이 있어요.

📚 활용 팁: 스마트폰에서도 기본 브라우저로 설정하면 ‘읽기 모드’, ‘코파일럿’ 등 엣지의 다른 유용한 기능과 함께 사용할 수 있습니다.


🎯 나만의 활용 시나리오: AI 음성과 함께하는 하루


AI 음성 서비스 정말 다양하죠? 저는 매일 아침부터 저녁까지, 이렇게 활용하고 있습니다.


  • 🌤️ 아침 날씨는 에이닷으로 체크
  • 😊 수업 준비와 전문적인 수다 떨기는 챗GPT AVM과 함께
  • 📚 학생들과 긴 웹 문서는 엣지의 시각 하이라이팅 기능으로
  • 🎙️ 블로그용 오디오 콘텐츠는 일레븐랩스의 전문적인 음성으로
  • 🌐 일상적인 웹 서핑과 읽기는 스피치파이로 자유롭게
  • 🔍 궁금한 것이 생기면 펄플렉시티로 빠르게 검색
  • 🏠 집에서는 클로바로 스마트홈 제어하며 편하게
  • 🤗 기분이 울적할 땐 코파일럿의 부드러운 목소리로 위로받기
  • 🎭 감성적인 대화가 필요할 땐 흄 AI의 다채로운 감정 표현으로
  • 💬 자기 전 영어 회화 연습은 제미나이와 함께


💭 마치며


AI 음성 기술은 계속해서 발전하고 있습니다. 특히 장애인의 관점에서 보면, 이러한 발전은 정보 접근성을 크게 향상시키고 있죠. 인간-컴퓨터 상호작용(HCI) 분야에서 AI 음성은 핵심적인 역할을 하기 때문에 앞으로도 계속된 투자가 이루어질 것으로 예상됩니다.

물론, 아직은 AI 음성 서비스의 한계도 명확하죠. 당장 챗GPT만 하더라도 음성 대화 모드에서는 실시간 검색이 되지 않는 기술적 한계가 존재하니까요. 또 하나의 허들은 비용인데요. AI 음성과 관련된 많은 서비스가 유료로 제공되고 있습니다. 개별적으로 보면 점차 비용이 낮아진다고 볼 수 있지만 서비스가 다양화되면서 전체적으로는 소비자에게 부담이 커지는 구조입니다. 만약 AI 음성 서비스를 정보 취약 계층을 위한 디지털 포용의 관점에서 접근한다면 관련된 법적 근거와 정책 마련도 고민해 볼 수 있겠지요.

하지만 이 모두에 앞서 이러한 미래 기술을 적극적으로 사용해 보면서 우리의 현재에서 유용한 활용 사례를 찾는 것이 우선일 것입니다. 그런 의미에서 여러분은 어떤 AI 음성 서비스를 사용하고 계신가요? 

이 글에 대한 의견이나 질문이 있으시다면 댓글로 남겨주세요! 🙋‍♂️ 함께 이야기 나누면서 좋은 정보를 많이 공유할 수 있었으면 좋겠습니다. 🎧🗣️

구글이 AI 튜터를 만드는 방법

AI 음성으로 듣기 - ElevenLabs

구글은 지난 5월 14일에 LearnLM이라는 언어 모델을 발표했다. LearnLM은 제미나이 1.0을 교육 목적으로 파인튜닝한 모델이다. 구글 딥마인드 연구팀은 LearnLM을 소개하면서 아카이브(arXiv)에 연구 보고서도 함께 발표했다. 이 연구 보고서는 AI를 실질적으로 쓸 만한 AI 튜터로 만들기 위해서 반드시 먼저 정의하고 해결해야 하는 문제들을 체계적으로 분류하고 정리한 결과물이다.

구체적으로 보면, 구글 딥마인드 팀은 AI 튜터의 효과성을 검증하는 평가 프레임워크를 개발했고(7개의 벤치마크 포함), 안전성 프로토콜과 윤리적 가이드라인을 수립했고 무엇보다 제미나이 1.0 베이스 모델보다 교육학적으로 더 나은 언어 모델로 개발했다. 개발 과정에서 AI가 만든 데이터에서부터 교육 전문가가 직접 만든 데이터까지 다양한 레벨의 데이터셋을 만들어 학습시켰고 각각의 응답 및 대화에 대해서 실제 교육자 및 학생의 피드백도 반영했다. 그리고 이를 실제 교육 환경(애리조나 주립 대학교)에 적용해 효과성을 입증했다.

연구의 한계도 명확하게 보고서에 적시했다. 텍스트 기반 상호작용으로 제한되었고 강화학습(RL) 단계는 시행하지 못했다는 기술적 한계부터, 여전히 평가의 신뢰성 확보에 대한 어려움과 장기적 실용성을 검증하지 못했다는 점 등을 한계로 제시했다. 다문화 지원 확대와 문화적 다양성 을 고려한 개선사항 등의 향후 과제도 보고서에 남겼다.

최근 연구 책임자인 아이리나 주렌카(Irina Jurenka)가 구글 딥마인드 팟캐스트에 출연해서 LearnLM 개발 과정과 연구 보고서에 관해서 설명했다. 이 연구는 AI를 교육에 활용하기 위한 첫걸음에 불과하고 이제서야 연구해야 할 범위와 깊이를 확인한 정도의 성과로 봐 주면 좋겠다고 했다.

나는 개인적으로 8월 28일 제미나이 어드밴스드 업데이트 직후에 LearnLM을 직접 써 보면서 놀라움을 금치 못했다. 챗GPT나 다른 어떤 언어 모델보다도 학습에 맞춤화 된 대화가 가능했다. 이 정도라면 정말 학생들에게도 유용하리라는 생각이 들었다. 하지만 이 정도의 완성도에도 불구하고 제미나이는 현재 18세 이상으로 사용이 제한되어 있다. 보고서에 언급된 학생 피드백도 모두 애리조나 주립 대학교 학생들의 피드백이다. 구글이 얼마나 신중하게 AI튜터에 접근하고 있는지 보여주는 대목이다.

구글이 교육 분야에 투자해 온 것은 이미 15년이 넘었다. LearnLM을 사용해 보면서 얼마나 많은 연구자와 개발자가 이 프로젝트에 참여했을지 궁금했는데 이 보고서를 통해 구글 딥마인드가 교육용 LLM 파인튜닝을 위해 얼마나 많은 연구 역량을 투입했는지 알 수 있었다. 에듀테크 업계에 있는 사람들과 에듀테크에 관심이 있는 사람이라면 꼭 읽어 보시길 추천한다.

LearnLM은 제미나이 챗봇에서 Learning coach라는 젬(Gem)으로 사용해 볼 수 있다. 유튜브에서도 일부 교육용 영상에 적용되어 있다고 한다. 추후에는 구글 검색의 'AI 개요'에도 들어갈 것이라고 한다.

[강의안] AI를 장애인 번역사의 편으로 만드는 방법 - 2024 우리동작 번역 페스티벌

오디오로 들으시려면 play 버튼을 눌러 주세요. 이 음성은 인공지능 서비스 Elevenlabs를 이용해 만들었습니다.

지난 8월 16일, 이룸센터에서 열린 2024 우리동작 번역 페스티벌에서 "AI를 장애인 번역사의 편으로 만드는 방법"이라는 주제로 강연을 진행했습니다. 이 강의는 AI 기술의 급속한 발전으로 변화하는 번역 환경 속에서 장애인 번역사들이 새로운 기회를 창출하고 경쟁력을 유지할 수 있도록 돕고자 준비했습니다.

ChatGPT, DeepL, 네이버 파파고, Claude 등 주요 번역 도구들에 대해 그 기능과 특징을 비교 분석하고,  실제 번역 실습을 통해 AI 도구를어떻게 효과적으로 활용할 수 있을지 체험하는 시간을 가졌습니다. 또한 AI가 대체할 수 없는 인간 번역사만의 고유한 역할과 필요 역량에 대해서도 깊이 있게 논의했습니다.

특히, 장애인 번역사 들이 AI 기술을 통해 더욱 편리하게 번역 업무를 수행하고,  더 나아가 자신만의 강점을 살려 새로운 기회를 만들어갈 수 있는 가능성을 함께 모색했습니다. AI를 '두려움의대상'이 아닌 '든든한 조력자'로 만들어,  함께 성장하는 미래를 그려보는 시간이었습니다.

강의 준비와 지금 이 블로그 글을 쓰는 과정에서도 AI 도구인 Claude를 활용해 초안을 작성했습니다. 글의 톤이 다소 추상적이고 부자연스러운 것은 이 때문입니다. 하지만 그럼에도 강의안에 하고자 하는 말의 핵심 내용은 충분히 담았습니다.

AI 시대의 번역이 단순한 언어 간 전환을 넘어 다양한 경험과 관점을 포용하는 문화적 가교 역할을 할 수 있기를, 그리고 그 과정에서 장애인 번역사들의 독특한 시각과 경험이 중요한 역할을 할 수 있기를 바랍니다.


강사 소개: 김헌용

김헌용은 한국외국어대학교 통번역대학원에서 한영 번역을 전공한 시각장애인 번역사입니다. 현재 신명중학교 영어교사로 재직 중이며, 우리동작장애인자립생활센터 번역가 양성과정의 운영위원으로 활동하고 있습니다.

2013년부터 장애인을 대상으로 번역 강의를 운영해왔으며, AI 시대의 번역 기술과 접근성에 깊은 관심을 가지고 있습니다. 주요 번역 작업으로는 「로스트 보이스 가이(책덕, 2022)」의 공동 번역 참여가 있습니다.


참고: 본 강연 내용은 2024년 8월 16일 우리동작 번역 페스티벌 강연을 위해 작성되었으며,  AI 언어 모델인 Claude의 도움을 받아 초안을 작성하였습니다.

궁금한 점이나 더 자세한 내용은 댓글로 문의해주세요!


강의안 전문은 아래 링크에서 확인하세요.

AI 사이트를 이용해서 유정과의 만남을 영어 그림책으로 만들어 보았어요! 📚✨

지난 2023년 크리스마스에 StoryBird라는 사이트를 이용해서 유정과의 만남을 그림책으로 만들어 보았어요. 🎄🎨

이 사이트는 이야기의 줄거리만 넣으면 그림책으로 완성해 주는데요. 제가 특히 마음에 드는 건 영어 내레이터 음성입니다. Sir Richard라는 내레이터가 나지막이 이야기를 읽어주는 것을 듣고 있자니 정말로 할아버지의 옛날 이야기를 듣는 것처럼 마음이 편안해 지네요! 🎶

한국어로도 제작이 가능하지만 오디오 내레이션까지 입힐 수 있는지는 확인을 못했습니다🤔.

그러고 보니 유정과 벚꽃 나리는 서울 거리에서 처음으로 손 잡고 걸었던 것이 9년 전 이맘때네요~ 🌸💑

아래 링크를 누르면 그림책을 감상하실 수 있어요! 🌟


Melodies of the Soul - StoryBird