구글이 AI 튜터를 만드는 방법

AI 음성으로 듣기 - ElevenLabs

구글은 지난 5월 14일에 LearnLM이라는 언어 모델을 발표했다. LearnLM은 제미나이 1.0을 교육 목적으로 파인튜닝한 모델이다. 구글 딥마인드 연구팀은 LearnLM을 소개하면서 아카이브(arXiv)에 연구 보고서도 함께 발표했다. 이 연구 보고서는 AI를 실질적으로 쓸 만한 AI 튜터로 만들기 위해서 반드시 먼저 정의하고 해결해야 하는 문제들을 체계적으로 분류하고 정리한 결과물이다.

구체적으로 보면, 구글 딥마인드 팀은 AI 튜터의 효과성을 검증하는 평가 프레임워크를 개발했고(7개의 벤치마크 포함), 안전성 프로토콜과 윤리적 가이드라인을 수립했고 무엇보다 제미나이 1.0 베이스 모델보다 교육학적으로 더 나은 언어 모델로 개발했다. 개발 과정에서 AI가 만든 데이터에서부터 교육 전문가가 직접 만든 데이터까지 다양한 레벨의 데이터셋을 만들어 학습시켰고 각각의 응답 및 대화에 대해서 실제 교육자 및 학생의 피드백도 반영했다. 그리고 이를 실제 교육 환경(애리조나 주립 대학교)에 적용해 효과성을 입증했다.

연구의 한계도 명확하게 보고서에 적시했다. 텍스트 기반 상호작용으로 제한되었고 강화학습(RL) 단계는 시행하지 못했다는 기술적 한계부터, 여전히 평가의 신뢰성 확보에 대한 어려움과 장기적 실용성을 검증하지 못했다는 점 등을 한계로 제시했다. 다문화 지원 확대와 문화적 다양성 을 고려한 개선사항 등의 향후 과제도 보고서에 남겼다.

최근 연구 책임자인 아이리나 주렌카(Irina Jurenka)가 구글 딥마인드 팟캐스트에 출연해서 LearnLM 개발 과정과 연구 보고서에 관해서 설명했다. 이 연구는 AI를 교육에 활용하기 위한 첫걸음에 불과하고 이제서야 연구해야 할 범위와 깊이를 확인한 정도의 성과로 봐 주면 좋겠다고 했다.

나는 개인적으로 8월 28일 제미나이 어드밴스드 업데이트 직후에 LearnLM을 직접 써 보면서 놀라움을 금치 못했다. 챗GPT나 다른 어떤 언어 모델보다도 학습에 맞춤화 된 대화가 가능했다. 이 정도라면 정말 학생들에게도 유용하리라는 생각이 들었다. 하지만 이 정도의 완성도에도 불구하고 제미나이는 현재 18세 이상으로 사용이 제한되어 있다. 보고서에 언급된 학생 피드백도 모두 애리조나 주립 대학교 학생들의 피드백이다. 구글이 얼마나 신중하게 AI튜터에 접근하고 있는지 보여주는 대목이다.

구글이 교육 분야에 투자해 온 것은 이미 15년이 넘었다. LearnLM을 사용해 보면서 얼마나 많은 연구자와 개발자가 이 프로젝트에 참여했을지 궁금했는데 이 보고서를 통해 구글 딥마인드가 교육용 LLM 파인튜닝을 위해 얼마나 많은 연구 역량을 투입했는지 알 수 있었다. 에듀테크 업계에 있는 사람들과 에듀테크에 관심이 있는 사람이라면 꼭 읽어 보시길 추천한다.

LearnLM은 제미나이 챗봇에서 Learning coach라는 젬(Gem)으로 사용해 볼 수 있다. 유튜브에서도 일부 교육용 영상에 적용되어 있다고 한다. 추후에는 구글 검색의 'AI 개요'에도 들어갈 것이라고 한다.

[팁] 아이폰 단축어(Shortcuts)로 챗GPT 음성 대화 모드 더 간편하게 시작하기

AI 음성으로 듣기 - ElevenLabs


챗GPT의 고급 음성 대화 모드가 많은 호평을 받고 있습니다. 특히 시각장애인 사용자들에게는 높은 접근성으로 더욱 유용한 기능인데요. 오늘은 아이폰의 단축어 기능을 활용해 챗GPT의 음성 대화 모드를 더욱 편리하게 사용하는 방법을 소개하려고 합니다.

왜 단축어를 사용해야 할까요?

챗GPT 앱에서 음성 대화를 시작하려면 여러 단계를 거쳐야 합니다. 앱을 실행하고, 음성 대화 버튼을 찾아 누르는 과정이 필요하죠. 하지만 단축어를 사용하면 홈 화면에서 한 번의 탭으로 바로 음성 대화를 시작할 수 있습니다.

단축어 설정 방법 (보이스오버 사용 환경 기준)

  1. 아이폰에 기본 설치된 '단축어(Shortcuts)' 앱을 실행합니다. (앱을 찾기 어렵다면 설정 앱에서 '단축어'를 검색해도 됩니다.)
  2. 단축어의 홈 화면으로 이동합니다.
  3. '앱 단축어' 헤딩 아래에서 챗GPT를 찾아 선택합니다.
  4. 'Start voice conversation' 항목을 더블 탭한 후 길게 누릅니다.
  5. 팝업 메뉴에서 '홈 화면에 추가'를 선택합니다.

활용 팁

  • 독(Dock)에 넣어두면 어느 화면에서든 빠르게 접근할 수 있습니다.
  • 기본 이름인 'Start voice conversation' 대신 원하는 이름으로 변경할 수 있습니다. (예: "GPT 음성 대화" 등)
  • 자동화 기능과 결합하여 특정 시간이나 상황에서 자동으로 음성 대화가 시작되도록 설정할 수 있습니다. (예: 아침에 일어났을 때 일정 체크하기, 취침 전 일기 쓰기 등)

다른 유용한 단축어 활용 사례

아이폰의 단축어 기능은 챗GPT 외에도 다양한 앱에서 활용할 수 있습니다. 예를 들어 볼게요.

  • 음성 메모 바로 시작하기
  • 자주 연락하는 사람에게 빠르게 전화하기 (저는 활동지원사님에게 전화 걸기를 단축어로 추가했습니다!)
  • 특정 앱의 특정 기능 바로 실행하기 (저는 Be My Eyes 앱에서 봉사자에게 전화 걸기를 단축어로 추가했습니다!)
  • 자주 사용하는 설정 토글하기

특히 미국의 주요 앱들은 대부분 단축어 기능을 제공하고 있어, 이를 활용하면 스마트폰 사용 경험을 한층 더 효율적으로 만들 수 있습니다.

마치며

단축어는 단순한 바로가기 이상의 가치가 있습니다. 특히 보이스오버 사용자에게는 앱 접근성을 크게 향상시켜주는 도구가 될 수 있습니다. 챗GPT의 음성 대화 모드를 시작으로, 다른 유용한 단축어들도 찾아보시면서 여러분만의 효율적인 스마트폰 사용 환경을 만들어보시기 바랍니다.

[팁] 구글 어시스턴트 앱으로 번호가 저장되어 있지 않은 곳에 음성으로 전화 걸기

AI 음성 듣기 - ElevenLabs


가끔 식당이나 카페 등에 전화해서 주차 공간이나, 휠체어 진입 가능 여부, 영업 시간 등을 확인해야 할 때가 있는데요. 이 때 지도 앱이나 검색엔진 앱을 열어 검색하고 통화를 하는 방법도 있지만 단 한마디의 음성으로 이 작업을 수행하는 방법이 있습니다. 바로 구글 어시스턴트 앱을 사용하는 것인데요.


  1. 구글 어시스턴트 앱을 깔고 실행하면 바로 마이크가 활성화됩니다. 활성화되지 않는 경우 화면 하단 중앙에 있는 마이크를 탭합니다.
  2. "...에 전화 걸어"라고 말합니다. 가능하면 전화 걸고자 하는 시설의 정확한 명칭을 말합니다.
  3. 그럼 어시스턴트 앱이 자동으로 해당 전화번호를 인터넷에서 검색하고 전화까지 걸어 줍니다.


저는 일반 식당, 카페, 병원 등 여러 곳에 이런 방식으로 전화해서 통화를 많이 하는데요. 반응 속도도 빠르고 내 폰에 저장되어 있지 않은 전화번호도 말 한마디로 전화를 걸 수 있어서 매우 편리합니다. 오늘도 아기가 다니는 소아과에 이렇게 전화해서 진료 시간을 확인했네요.

구글 어시스턴트는 생성형 AI는 아닙니다. 하지만 구글의 다양한 서비스를 연동하고 사용할 수 있어서 편리한데요. 예를 들어, 구글 캘린더에 일정을 저장하고 확인하는 것도 어시스턴트를 활용하면 음성으로 수행할 수 있습니다. 어시스턴트 앱 깔아서 사용해 보세요~

장애인 소비자, 국내 기업에겐 그저 투명인간일 뿐인가?

음성으로 듣기 - ElevenLabs
오늘 한국 기업 셀바스의 미국 법인이 주최한 '브레일 이모션'이라는 제품의 데모 웨비나에 참여하며 씁쓸함을 느꼈다. 셀바스는 국내 기업으로 점자 디스플레이/태블릿 제품인 한소네를 만드는 회사이다. 한소네가 미국에서도 잘 팔리기 때문에 미국 법인이 있다.
웨비나의 말미에 마이크를 켜고 한국에서는 이런 웨비나가 잘 없어서 매우 흥미롭게 참여했다고 말하니 데모를 진행한 미국인 시각장애인이 대답한다.
"Ironic."
맞다. 내가 한국 제품에 대해 정보를 얻기 위해서 미국 사람들이 주최하는 웨비나에 참여해야 한다는 사실은 아이러니이다.

그런데 이런 경험이 처음이 아니다.
3년 전, 결혼을 앞두고 LG 가전제품을 대량으로 구매했을 때 나는 장애인 고객을 위한 안내가 전혀 없어서 모멸감을 느꼈었다. 당시 인권위에 차별 진정을 한 내용은 두 가지였다. 한 가지는 제품의 접근성이 부족하다는 것이었고 다른 한 가지는 장애인 고객에 대한 안내가 너무 없다는 것이었다.
그런데 당시 한국에서는 무엇이 이슈가 되었었냐 하면 루시 그레코라는 미국인이 LG 세탁기를 리뷰하면서 접근성이 부족하다고 말한 것이 이슈가 됐다. LG는 미국에서 루시 그레코를 찾아가서 인터페이스에 대한 자문을 얻고 점자 스티커를 붙여주면서 제품 개선을 약속했다.
정확히 같은 일이 3년이 지난 올해 2월 내게도 있었다. 관련해서는 블로그에 포스팅도 했지만 매우 감사한 일이다. 하지만 감사한 것과는 별개로 LG가 장애인 사용자와의 적극적인 소통을 한국이 아닌 미국에서 먼저 한 점은 여전히 아쉬움으로 남는다.

한국 기업들이 미국 시장에 공을 들일 수밖에 없는 이유야 수백 가지도 더 될 것이다. 미국은 시장도 크거니와 고객의 구매력도 크다. 그건 장애인 고객도 마찬가지일 것이다.
하지만 한국은 시장도 작고 그 중에 장애인 사용자의 구매력은 측정조차 불가능하다. LG 가전을 대규모로 구매할 수 있는 장애인 사용자가 국내에 과연 얼마나 될까? 아니, 시각장애인의 필수품이라고 할 수 있는 한소네조차도 온전히 자비로 구매한 한국인은 손에 꼽을 것이다. 그러니 LG전자는 물론이거니와 셀바스도 국내 시장에서 장애인 소비자를 대상으로 한 영업과 마케팅에는 공을 들이지 않는다.

장애인의 소비자 권리와 관련해서는 풀어가야 할 문제가 많이 있다. 하지만 복잡한 솔루션을 생각하기 전에 먼저 씁쓸한 분노를 느끼자.
한국의 장애인은 소비자로서는 투명인간일 뿐이다. 보조공학기기 업체에게도 그렇다.

[강의안] AI를 장애인 번역사의 편으로 만드는 방법 - 2024 우리동작 번역 페스티벌

오디오로 들으시려면 play 버튼을 눌러 주세요. 이 음성은 인공지능 서비스 Elevenlabs를 이용해 만들었습니다.

지난 8월 16일, 이룸센터에서 열린 2024 우리동작 번역 페스티벌에서 "AI를 장애인 번역사의 편으로 만드는 방법"이라는 주제로 강연을 진행했습니다. 이 강의는 AI 기술의 급속한 발전으로 변화하는 번역 환경 속에서 장애인 번역사들이 새로운 기회를 창출하고 경쟁력을 유지할 수 있도록 돕고자 준비했습니다.

ChatGPT, DeepL, 네이버 파파고, Claude 등 주요 번역 도구들에 대해 그 기능과 특징을 비교 분석하고,  실제 번역 실습을 통해 AI 도구를어떻게 효과적으로 활용할 수 있을지 체험하는 시간을 가졌습니다. 또한 AI가 대체할 수 없는 인간 번역사만의 고유한 역할과 필요 역량에 대해서도 깊이 있게 논의했습니다.

특히, 장애인 번역사 들이 AI 기술을 통해 더욱 편리하게 번역 업무를 수행하고,  더 나아가 자신만의 강점을 살려 새로운 기회를 만들어갈 수 있는 가능성을 함께 모색했습니다. AI를 '두려움의대상'이 아닌 '든든한 조력자'로 만들어,  함께 성장하는 미래를 그려보는 시간이었습니다.

강의 준비와 지금 이 블로그 글을 쓰는 과정에서도 AI 도구인 Claude를 활용해 초안을 작성했습니다. 글의 톤이 다소 추상적이고 부자연스러운 것은 이 때문입니다. 하지만 그럼에도 강의안에 하고자 하는 말의 핵심 내용은 충분히 담았습니다.

AI 시대의 번역이 단순한 언어 간 전환을 넘어 다양한 경험과 관점을 포용하는 문화적 가교 역할을 할 수 있기를, 그리고 그 과정에서 장애인 번역사들의 독특한 시각과 경험이 중요한 역할을 할 수 있기를 바랍니다.


강사 소개: 김헌용

김헌용은 한국외국어대학교 통번역대학원에서 한영 번역을 전공한 시각장애인 번역사입니다. 현재 신명중학교 영어교사로 재직 중이며, 우리동작장애인자립생활센터 번역가 양성과정의 운영위원으로 활동하고 있습니다.

2013년부터 장애인을 대상으로 번역 강의를 운영해왔으며, AI 시대의 번역 기술과 접근성에 깊은 관심을 가지고 있습니다. 주요 번역 작업으로는 「로스트 보이스 가이(책덕, 2022)」의 공동 번역 참여가 있습니다.


참고: 본 강연 내용은 2024년 8월 16일 우리동작 번역 페스티벌 강연을 위해 작성되었으며,  AI 언어 모델인 Claude의 도움을 받아 초안을 작성하였습니다.

궁금한 점이나 더 자세한 내용은 댓글로 문의해주세요!


강의안 전문은 아래 링크에서 확인하세요.