구글이 AI 튜터를 만드는 방법

AI 음성으로 듣기 - ElevenLabs

구글은 지난 5월 14일에 LearnLM이라는 언어 모델을 발표했다. LearnLM은 제미나이 1.0을 교육 목적으로 파인튜닝한 모델이다. 구글 딥마인드 연구팀은 LearnLM을 소개하면서 아카이브(arXiv)에 연구 보고서도 함께 발표했다. 이 연구 보고서는 AI를 실질적으로 쓸 만한 AI 튜터로 만들기 위해서 반드시 먼저 정의하고 해결해야 하는 문제들을 체계적으로 분류하고 정리한 결과물이다.

구체적으로 보면, 구글 딥마인드 팀은 AI 튜터의 효과성을 검증하는 평가 프레임워크를 개발했고(7개의 벤치마크 포함), 안전성 프로토콜과 윤리적 가이드라인을 수립했고 무엇보다 제미나이 1.0 베이스 모델보다 교육학적으로 더 나은 언어 모델로 개발했다. 개발 과정에서 AI가 만든 데이터에서부터 교육 전문가가 직접 만든 데이터까지 다양한 레벨의 데이터셋을 만들어 학습시켰고 각각의 응답 및 대화에 대해서 실제 교육자 및 학생의 피드백도 반영했다. 그리고 이를 실제 교육 환경(애리조나 주립 대학교)에 적용해 효과성을 입증했다.

연구의 한계도 명확하게 보고서에 적시했다. 텍스트 기반 상호작용으로 제한되었고 강화학습(RL) 단계는 시행하지 못했다는 기술적 한계부터, 여전히 평가의 신뢰성 확보에 대한 어려움과 장기적 실용성을 검증하지 못했다는 점 등을 한계로 제시했다. 다문화 지원 확대와 문화적 다양성 을 고려한 개선사항 등의 향후 과제도 보고서에 남겼다.

최근 연구 책임자인 아이리나 주렌카(Irina Jurenka)가 구글 딥마인드 팟캐스트에 출연해서 LearnLM 개발 과정과 연구 보고서에 관해서 설명했다. 이 연구는 AI를 교육에 활용하기 위한 첫걸음에 불과하고 이제서야 연구해야 할 범위와 깊이를 확인한 정도의 성과로 봐 주면 좋겠다고 했다.

나는 개인적으로 8월 28일 제미나이 어드밴스드 업데이트 직후에 LearnLM을 직접 써 보면서 놀라움을 금치 못했다. 챗GPT나 다른 어떤 언어 모델보다도 학습에 맞춤화 된 대화가 가능했다. 이 정도라면 정말 학생들에게도 유용하리라는 생각이 들었다. 하지만 이 정도의 완성도에도 불구하고 제미나이는 현재 18세 이상으로 사용이 제한되어 있다. 보고서에 언급된 학생 피드백도 모두 애리조나 주립 대학교 학생들의 피드백이다. 구글이 얼마나 신중하게 AI튜터에 접근하고 있는지 보여주는 대목이다.

구글이 교육 분야에 투자해 온 것은 이미 15년이 넘었다. LearnLM을 사용해 보면서 얼마나 많은 연구자와 개발자가 이 프로젝트에 참여했을지 궁금했는데 이 보고서를 통해 구글 딥마인드가 교육용 LLM 파인튜닝을 위해 얼마나 많은 연구 역량을 투입했는지 알 수 있었다. 에듀테크 업계에 있는 사람들과 에듀테크에 관심이 있는 사람이라면 꼭 읽어 보시길 추천한다.

LearnLM은 제미나이 챗봇에서 Learning coach라는 젬(Gem)으로 사용해 볼 수 있다. 유튜브에서도 일부 교육용 영상에 적용되어 있다고 한다. 추후에는 구글 검색의 'AI 개요'에도 들어갈 것이라고 한다.

[팁] 아이폰 단축어(Shortcuts)로 챗GPT 음성 대화 모드 더 간편하게 시작하기

AI 음성으로 듣기 - ElevenLabs


챗GPT의 고급 음성 대화 모드가 많은 호평을 받고 있습니다. 특히 시각장애인 사용자들에게는 높은 접근성으로 더욱 유용한 기능인데요. 오늘은 아이폰의 단축어 기능을 활용해 챗GPT의 음성 대화 모드를 더욱 편리하게 사용하는 방법을 소개하려고 합니다.

왜 단축어를 사용해야 할까요?

챗GPT 앱에서 음성 대화를 시작하려면 여러 단계를 거쳐야 합니다. 앱을 실행하고, 음성 대화 버튼을 찾아 누르는 과정이 필요하죠. 하지만 단축어를 사용하면 홈 화면에서 한 번의 탭으로 바로 음성 대화를 시작할 수 있습니다.

단축어 설정 방법 (보이스오버 사용 환경 기준)

  1. 아이폰에 기본 설치된 '단축어(Shortcuts)' 앱을 실행합니다. (앱을 찾기 어렵다면 설정 앱에서 '단축어'를 검색해도 됩니다.)
  2. 단축어의 홈 화면으로 이동합니다.
  3. '앱 단축어' 헤딩 아래에서 챗GPT를 찾아 선택합니다.
  4. 'Start voice conversation' 항목을 더블 탭한 후 길게 누릅니다.
  5. 팝업 메뉴에서 '홈 화면에 추가'를 선택합니다.

활용 팁

  • 독(Dock)에 넣어두면 어느 화면에서든 빠르게 접근할 수 있습니다.
  • 기본 이름인 'Start voice conversation' 대신 원하는 이름으로 변경할 수 있습니다. (예: "GPT 음성 대화" 등)
  • 자동화 기능과 결합하여 특정 시간이나 상황에서 자동으로 음성 대화가 시작되도록 설정할 수 있습니다. (예: 아침에 일어났을 때 일정 체크하기, 취침 전 일기 쓰기 등)

다른 유용한 단축어 활용 사례

아이폰의 단축어 기능은 챗GPT 외에도 다양한 앱에서 활용할 수 있습니다. 예를 들어 볼게요.

  • 음성 메모 바로 시작하기
  • 자주 연락하는 사람에게 빠르게 전화하기 (저는 활동지원사님에게 전화 걸기를 단축어로 추가했습니다!)
  • 특정 앱의 특정 기능 바로 실행하기 (저는 Be My Eyes 앱에서 봉사자에게 전화 걸기를 단축어로 추가했습니다!)
  • 자주 사용하는 설정 토글하기

특히 미국의 주요 앱들은 대부분 단축어 기능을 제공하고 있어, 이를 활용하면 스마트폰 사용 경험을 한층 더 효율적으로 만들 수 있습니다.

마치며

단축어는 단순한 바로가기 이상의 가치가 있습니다. 특히 보이스오버 사용자에게는 앱 접근성을 크게 향상시켜주는 도구가 될 수 있습니다. 챗GPT의 음성 대화 모드를 시작으로, 다른 유용한 단축어들도 찾아보시면서 여러분만의 효율적인 스마트폰 사용 환경을 만들어보시기 바랍니다.

네이버와 Daum에게 빼앗긴 뉴스 콘텐츠의 다양성

AI 음성으로 듣기 - ElevenLabs


포털 사이트가 뉴스 미디어 생태계에 미친 영향은 복잡하다. 그 중에서 네이버와 Daum과 같은 포털 사이트가 뉴스 기사 전문을 직접 제공하는 현행 방식은 소비자에게단기적 편익보다 장기적 손실이 더 크다고 생각한다. 내가 생각하는 손실은 이것이다.


첫째, 포털 뉴스 서비스는 뉴스 미디어의 UI(사용자 인터페이스) 혁신을 저해했다. 포털이 뉴스 기사 전문을 제공하면서 각 언론사의 웹사이트는 사용자 경험 측면에서 경쟁력을 상실했다.콘텐츠는 내용만큼이나 형식도 중요한데, 뉴스 미디어들은 UI 개선의 기회를 근본적으로 놓쳤다. 최근 회원제나 구독 시스템으로의 전환을 시도하고 있지만 UI에 대한 축적된 경험이 부족하다 보니 섬세한 변화보다는 뉴스레터 같이 눈에 띄는 트렌드를 좇기에 급급하다.

둘째, 뉴스 미디어의 브랜드 가치가 약화되었다. 어느 콘텐츠이든 내용만큼이나 메신저에 대한 이미지도 중요하다. 그러나 포털을 통해 노출되는 기사는 그 뉴스 미디어의 정체성과 특성이 희석된 채 전달된다. 이는 각 미디어의 브랜드 이미지를 약화시켰고, 미디어들도 브랜드에 대한 고민을 상대적으로 덜 하게 만들었다. 브랜드의 평판이나 콘텐츠의 일관성은 장기적으로 콘텐츠의 품질에 큰 영향을 미치는데 뉴스 미디어들이 인스턴트성 기사에 집착하게 되면서 콘텐츠 품질이 하향 평준화되었다.


물론 포털 사이트가 뉴스의 접근성을 높였다는 긍정적 측면도 있다. 특히 공적 가치를 고려하면 접근성은 매우 중요한 가치이다. 하지만 포털 사이트의 정치적 편향성에 대한 의혹이 제기될 즈음 이미 공적 콘텐츠의 매개채로서의 기능은 상당 부분 상실했다고 본다.그리고 이제는 소비자가 뉴스를 접할 수 있는 접근 경로가 다양해졌다는 점에서 더 이상 포털 사이트의 중계가 필요한가 하는 의문이 든다.

오히려 뉴스 미디어들이 네이버나 Daum에 종속되기를 거부하고 UI와 브랜드에 대한 고민을 더욱 치열하게 하면서 소비자들에게 더욱 가까이 다가가려는 노력을 했다면 지금보다 더욱 견고한 뉴스 미디어 시장이 만들어지지 않았을까? 뉴스 미디어들의 노력 부족을 탓하기에는 소비자의 목소리가 너무 적었던 것도 사실이다. 소비자가 요구하지 않는데 뉴스 미디어들이 스스로 험한 길을 택했어야 한다는 평가는 가혹하다.

누구 탓이든 간에 뉴스 미디어들의 오랜 기간 포털 사이트의 종속으로 인해 우리나라의 뉴스 콘텐츠 다양성은 많이 축소되었다. 2010년대에 시도되었던 뉴 미디어 스타트업들은 대부분 사라졌고, 소비자들은 뉴스 콘텐츠의 다양성 저하와 품질 저하를 경험하고 있다.


그렇다면 대안은 무엇일까?


이러한 문제를 해결하는 작은 변화로, 지금이라도 네이버와 Daum이 뉴스 기사 전문을 보여주는 대신 기사 제목을 누르면 해당 웹 페이지로 연결해주는 방식으로의 전환이 이루어졌으면 좋겠다. 이건 구글 방식이다. 구글은 기사 본문을 보여주지 않고 해당 웹 페이지로 리디렉팅하는 방법을 채택하고 있다.

요즘 나는 육아를 하면서 틈틈이 뉴스를 구글의 모바일 앱으로 소비하고 있다. 그리고 이렇게 방식을 바꾼 이후로 하루 중 뉴스 콘텐츠를 읽는 시간이 비약적으로 늘었다. 뿐만 아니라 구독하는 뉴스 미디어도 늘었다. 예전처럼 페이스북이나 카카오톡 같은 소셜 미디어에 의존하지도 않고, 이메일 뉴스레터에만 의존하지도 않는다. 무엇보다도 뉴스 콘텐츠의 깊이와 다양성에 매일매일 놀라고 있다.

구글 앱에 올라오는 뉴스를 보고 있자면 마치 소셜 미디어의 뉴스피드처럼 하루에도 수많은 기사들이 쏟아진다는 걸 알 수 있다. 그 중에는 나의 인식의 지평을 넓혀주는 아티클도 많이 있다. 영상 콘텐츠가 대세라고 하지만 여전히 복잡하고 추상적인 정보는 글로 접하는 것이 훨씬 더 효과적이다.


결론적으로 네이버와 Daum도 뉴스 기사 전문 제공 방식을 개선하면 좋겠다. 뉴스 미디어들도 포털이라는 보조 바퀴이자 족쇄를 벗어버리고 스스로 경쟁력을 높여가야 한다. 이는 결과적으로 포털 사이트의 경쟁력도 강화해 줄 것이다. 무엇보다 이러한 변화는 소비자에게 더욱 다양하고 질 높은 뉴스 콘텐츠를 제공하는 계기가 될 것이다.

[팁] 구글 어시스턴트 앱으로 번호가 저장되어 있지 않은 곳에 음성으로 전화 걸기

AI 음성 듣기 - ElevenLabs


가끔 식당이나 카페 등에 전화해서 주차 공간이나, 휠체어 진입 가능 여부, 영업 시간 등을 확인해야 할 때가 있는데요. 이 때 지도 앱이나 검색엔진 앱을 열어 검색하고 통화를 하는 방법도 있지만 단 한마디의 음성으로 이 작업을 수행하는 방법이 있습니다. 바로 구글 어시스턴트 앱을 사용하는 것인데요.


  1. 구글 어시스턴트 앱을 깔고 실행하면 바로 마이크가 활성화됩니다. 활성화되지 않는 경우 화면 하단 중앙에 있는 마이크를 탭합니다.
  2. "...에 전화 걸어"라고 말합니다. 가능하면 전화 걸고자 하는 시설의 정확한 명칭을 말합니다.
  3. 그럼 어시스턴트 앱이 자동으로 해당 전화번호를 인터넷에서 검색하고 전화까지 걸어 줍니다.


저는 일반 식당, 카페, 병원 등 여러 곳에 이런 방식으로 전화해서 통화를 많이 하는데요. 반응 속도도 빠르고 내 폰에 저장되어 있지 않은 전화번호도 말 한마디로 전화를 걸 수 있어서 매우 편리합니다. 오늘도 아기가 다니는 소아과에 이렇게 전화해서 진료 시간을 확인했네요.

구글 어시스턴트는 생성형 AI는 아닙니다. 하지만 구글의 다양한 서비스를 연동하고 사용할 수 있어서 편리한데요. 예를 들어, 구글 캘린더에 일정을 저장하고 확인하는 것도 어시스턴트를 활용하면 음성으로 수행할 수 있습니다. 어시스턴트 앱 깔아서 사용해 보세요~

도도가 세례를 받았다

AI 음성으로 듣기 - ElevenLabs


도도가 J동성당에서 세례를 받았다. 생후 200일을 1주일 정도 앞둔 10월 13일이었다. 무신론자인 나에게도 세례식은 특별했다.

사진 설명: 제기동 성당에서 진행된 도도 이시도로의 세례식 장면이다. 나무로 된 강단 앞에 서 있는 유정과 헌용, 그리고 도도의 대부 테오도로의 모습이 보인다. 헌용이 안고 있는 도도가 대부님을 바라보고 있다. 가족 모두가 정장 차림으로 특별한 날의 의미를 더하는 분위기이다. - Described by Claude

한 사람이 특별한 공로나 조건 없이 어떤 커뮤니티로부터 받아들여지고 환대받는다는 것, 그리고 그것을 의례로 공식화한다는 것은 강렬하게 따뜻한 경험이다. 더군다나 천주교는 이렇게 받아들여진 신자에게 성인의 이름을 딴 세례명을 선사한다. 세례받은 사람은 자연스럽게 세례명의 주인공인 성인과 동일시하며 그 삶의 궤적을 따라 살려고 노력하게 된다. 그래서일까. 천주교인 사람들끼리 만나면 꼭 서로 세례명을 물어보곤 한다. 마치 그로부터 서로의 삶의 태도에 대한 힌트를 얻기라도 하는 것처럼.
도도의 세례명은 이시도로이다. 세비야의 성인 이시도로(Isidore of Seville)는 축일이 도도의 생일과 가깝기도 하거니와 그의 삶은 우리 부부와 많이 공명한다. 6세기~7세기 세비야의 대주교를 지냈고 「어원론(Etymologiae)」이라는 당대의 백과사전을 펴내어 중세 유럽의 지식 전수와 교육에 크게 기여했다고 한다. 언어에 관심이 많아 통번역을 전공했고 이젠 각각 중학교와 고등학교에서 영어와 프랑스어를 가르치는 우리 부부와 통하는 대목이다. 그런가 하면 성 이시도르는 방대한 정보를 분류하고 체계화했다는 점에서 오늘날 인터넷과 프로그래머의 수호성인으로 여겨진다고 하는데 이 또한 힙하게 느껴지는 대목이다. 하지만 뭐니 뭐니해도 세례명을 이시도로로 결정한 것은 에스파냐의 정열을 가지고 있고, 도도의 ‘도’라는 글자에 남다른 애정을 가진 유정에겐 무척 자연스러운 선택이었다.

사진 설명: 세례식의 핵심 순간을 포착한 장면이다. 흰색 제의를 입은 신부님이 의식을 진행 중이며, 신부님에 가려 유정의 모습은 보이지 않는다. 검은색 정장을 입은 헌용이 도도 이시도로를 안고 있고, 도도 이시도로는 신부님을 호기심 어린 눈으로 바라보고 있다. 옆에 서 있는 대부 테오도로가 미소를 지으며 도도 이시도로를 바라보고 있다. 전체적으로 경건하면서도 따뜻한 분위기가 느껴진다. - Described by Claude

세례식은 유정의 고등학교 절친이기도 하면서 직장인 밴드 보컬이기도 한 C의 아기 D와 함께여서 더 특별했다. 생년월일이 겨우 10주밖에 차이 나지 않는 두 남자아이가 같은 날 함께 세례를 받으니 세례식 내내 가족들의 기쁨이 두 배가 되었다. 도도의 대부가 되어준 테오도로는 제기동 성당에서 유정이 오랫동안 알고 지낸 청년으로 이젠 나와도 인연이 깊다. 만날 때면 늘 남다른 센스로 나를 잘 챙겨줄 뿐 아니라 취미로 베이스 기타를 친다는 흔치 않은 공통점도 있다. 사실 TMI를 밝히자면, 지금 내가 갖고 있는 메인 베이스 기타는 테오도로로부터 중고로 구매한 것이다! 아무튼 좋은 날, 좋은 사람들과 더욱 깊은 인연을 맺는 자리여서 더 행복했다.
한편 세례를 받는 도도는 어떤 느낌이었을까? 세례식 내내 내 품에 얌전히 안겨 있었고 가끔은 신부님의 말씀에 “아아아아~ 어어어어~”라고 추임새를 넣으며 화답해 주었다. 아마도 기분이 나쁘진 않은 것 같았다. 도도가 훗날 이 블로그 글이나 사진을 보면서 자신의 감정이나 생각을 표현할 수 있게 되었을 때 그때 다시 물어봐야겠다.
세례식 후에는 장인어른의 모교를 방문해 산책을 했다. 계획에 없던 일정이었는데 J동성당에서 멀지 않고 지형 경관이 넓게 탁 트여 있어 나도 유정도 도도도 모처럼 기분 좋은 캠퍼스 나들이를 했다. 봄 같이 포근한 날씨였다. 기후 변화로 아기를 마음 놓고 데리고 나갈 수 있는 날이 점점 줄어드는데 마침 적절한 제안을 해 주신 장인어른께 감사했다. 이렇게 도도가 세례를 받은 특별한 날이 가족과의 추억으로 잘 마무리되었다.
원래는 세례의 종교적 의미와 환대라는 주제로 이 블로그 글을 쓰려고 했지만 도도를 키운 후로 심오한 주제로는 글을 쓰기가 어렵게 되었다. 깊이 골몰할 만큼의 짬이 잘 안 나거니와, 아무리 심오한 생각을 한다 한들 애초에 도도의 성장을 바라보며 느끼는 경이로움만큼의 감흥이 내 안에서 잘 일어나지 않기 때문이다. 하지만 이 언급만은 꼭 남기고 싶다. 서두에 썼듯 조건 없이 누군가로부터 환대받는 것은 놀랍도록 강렬한 경험이다. 이 세상의 종교가 부디 모두에게 그런 강렬한 환대를 베풀어주었으면 좋겠다. 그야말로 어떠한 조건이나 차별 없이.