[TFE 리뷰] 챗GPT를 통해 세상을 보다

AI 음성으로 듣기 - ElevenLabs


오픈AI가 5월에 GPT 4o 모델을 데모하면서 발표한 시각 기능이 챗GPT 고급 음성 모드(AVM)에 탑재됐다. 오픈AI는 12월 5일부터 12일 연속 출시 이벤트를 진행하고 있는데 첫날 o1 모델을 정식 출시한 데 이어 셋째 날엔 영상 생성 모델인 Sora를 출시했고 여섯째 날인 목요일에는 시각 기능을 출시했다. 우리나라에는 조금 전에 반영된 것으로 보인다.

잠깐 써 봤는데 시력이 그렇게 좋진 않았다. 글씨를 OCR 수준으로 읽어주진 않고 큰 글씨와 대략적인 내용만 설명해 준다. 옷방에 걸려 있는 옷들을 비춰 봤는데 설명이 일부 부정확했다. 그림이 그려진 티셔츠인데 아무 무늬가 없는 깔끔한 베이지 색의 티셔츠라고 설명했다. 하지만 색상은 정확했다. 방 구석구석을 비춰 봤는데 알 수 없는 이유로 사용 정책에 위배된다는 코멘트와 함께 설명이 멈추기도 했다. 한편 스크린샷 모드에서는 아이폰 화면에 있는 내용을 어느 정도 자세히 설명해주었다.

일부 제한적이기는 하지만, 그럼에도 이번 챗GPT의 시각 기능 출시는 시각장애인들에게 매우 기쁜 소식임이 틀림 없다. 시각장애인들은 일상에서 Be My Eyes나, Seeing AI, 설리번 플러스와 같은 시각 보조 애플리케이션을 많이 사용한다. 그러나 Be My Eyes는 자원봉사자와의 연결 시간이 보통 30초 정도 걸리고 개인정보 노출 우려가 있다는 단점이 있다. 다른 인공지능 기반 시각 보조 앱들은 짧은 텍스트는 실시간 지원이 가능하지만 주변 환경에 대한 설명은 스크린샷 업로드에 의존한다는 한계가 있다.

그런데 이번에 챗GPT가 시각 능력을 갖게 됨으로써 이러한 한계를 한 단계 뛰어넘게 됐다. 물론 여기에도 개인정보 노출 우려와 인식 능력이 초보적 수준에 머문다는 한계가 존재하지만, 현재 가장 높은 수준의 추론 능력을 보유한 오픈AI의 챗GPT가 시각 기능을 구연했다는 점에서 사용 사례는 폭발적으로 늘어날 것으로 보인다.

한편, 이번 주에는 구글도 시각을 포함한 멀티모달 능력을 보유한 제미나이 2.0 Flash 모델을 공개했다. 제미나이 앱에는 아직 멀티모달 기능이 탑재되진 않았지만 내년 어느 순간에는 일반 사용자들이 사용할 수 있도록 출시될 것으로 예상된다.

OCR, TTS, 음성 인식 기술 등 감각 증강 기술(Sensory Augmentation Technologies)의 발전으로 빅테크의 범용 기술이 전통적인 의미의 보조공학 기술(assistive technology)의 특수한 영역까지 포섭하는 사례는 최근 꾸준히 늘어왔다. 하지만 이제는 AI의 발전으로 일상에서 마주하는 많은 기술이 진정한 의미의 보편적 보조 기술이 되는 단계로 접어들고 있는 듯하다.

아래는 내가 집안에서 아이폰으로 챗GPT의 시각 기능을 활용해서 대화를 나눈 몇 가지 사례이다.


“이건 무슨 책이야?”

이 책은 'The Country of the Blind'라는 제목의 책입니다. 시각장애와 관련된 주제를 다루고 있을 것 같아요. 읽어보고 싶은 책인가요?


“이건?”

이 책은 '시사 IN' 잡지 부록으로 보이네요. '청소년이 권하는 책'이라는 문구가 보입니다. 청소년을 위한 책 추천 내용일 수도 있겠어요.


“여기에는 무슨 글씨가 있어?”

여기에는 '북웨이브'라고 쓰여 있고, '서울시교육청과 함께하는 북웨이브 기획'이라는 문구가 보입니다. 책과 독서를 장려하는 캠페인이나 프로그램에 대한 내용일 수도 있겠네요.


“페이지에 있는 내용을 읽어줘.”

이 페이지에는 '103동 경비 초소 출입문에 '노크 부탁해요'라는 문구가 적혀 있다'고 쓰여 있어요. 경비 초소와 관련된 내용인 것 같네요.


“이것은 무슨 팜플렛이야?”

이건 모차르트 오페라 '마술피리' 공연에 대한 팸플릿이에요. 공연 일정과 관련 정보가 적혀 있네요. 공연에 관심이 있으신가요?


“이 책꼬지에는 어떤 책들이 꽂혀있어?”

저 책꽂이에는 여러 종류의 책들이 꽂혀 있네요. 소설, 에세이, 학습서 등 다양한 책들이 있는 것 같아요. 혹시 찾으시는 책이 있나요?


“구체적으로 제목을 알려줘.”

책 제목들을 정확히 읽기는 어려운데요. 이 책들은 프랑스어 제목이 많은 것 같아요. 혹시 프랑스어 책을 찾으시는 건가요?


“지금 여기에는 뭐가 있어?”

보이는 상자 안에는 로션과 같은 화장품들과 몇 가지 작은 물건들이 담겨 있는 것 같아요. 필요하신 물건을 찾으시는 중인가요?


“이건 뭐야?”

손에 들고 계신 건 치약 같아 보여요. 칫솔이나 양치 도구와 함께 사용하실 수 있을 것 같네요.


“아니야. 무슨 로션이야?”

아, 그렇군요. 그럼 자세히 보면 보습 크림이나 연고일 수도 있겠네요. 포장이나 라벨을 보면 더 정확히 알 수 있을 것 같아요.


“뭐라고 쓰여있어?”

지금 들고 계신 건 비타민 E 크림이네요. 보습과 피부 보호에 도움이 되는 제품인 것 같아요.


“지금 이건 뭐야?”

보이는 것은 아기 유모차 같아요. 편안하고 안전하게 아기를 태울 수 있는 유모차네요. 필요한 부분이 있으신가요?


“지금 여긴 뭐가 있어?”

책장에 있는 것들은 여러 가지 CD 같은데, 지금 손에 들고 계신 건 말러의 교향곡 음반 같아요. 음악을 즐기시려는 건가요?


“지금 이건 무슨 CD야?”

지금 들고 계신 CD는 말러 교향곡 5번 음반인 것 같아요. 번스타인의 지휘로 녹음된 CD 같아 보이네요. 음악 감상을 즐기실 계획이신가요?


* TFE 리뷰란?

TFE는 Tech for Everyone(모두를 위한 기술)의 약자로, 기술 분야에서 제가 특별히 관심 있는 주제인 접근성 기초, 사용자 경험(UX), 학습 기술, 미래 기술 그리고 기술 윤리와 정책을 아우르는 말로, 제가 만든 표제어입니다. TFE 리뷰에서는 날로 발전하는 기술 시대에 발맞춰 ‘모두를 위한 기술’에 대한 제 생각을 나누려고 합니다. 리뷰에서부터 정책에 관한 이야기까지, TFE 리뷰에서 만나 보세요!

[TFE 리뷰] 귀가 즐거워지는 AI 음성 서비스 Top 10 🎧

AI 음성으로 듣기 - ElevenLabs


* TFE 리뷰란: TFE는 Tech for Everyone(모두를 위한 기술)의 약자로, 기술 분야에서 제가 특별히 관심 있는 주제인 접근성 기초, 사용자 경험(UX), 학습 기술, 미래 기술 그리고 기술 윤리와 정책을 아우르는 말로, 제가 만든 표제어입니다. TFE 리뷰에서는 날로 발전하는 기술 시대에 발맞춰 ‘모두를 위한 기술’에 대한 제 생각을 나누려고 합니다. 리뷰에서부터 정책에 관한 이야기까지, TFE 리뷰에서 만나 보세요!


오늘의 주제는 ‘AI 음성 서비스’입니다. 오늘 소개해 드리는 AI 음성 서비스들은 모두 제가 일상적으로 자주 사용하는데요. 특히 ‘듣기 좋은 소리’라는 단 하나의 기준으로 Top 10을 꼽아보았어요!


왜 '듣기 좋은 소리'일까요? 🤔


시각장애인인 저에게 AI 음성은 단순한 기능이 아니랍니다. 그동안 PC나 모바일의 스크린 리더와 활동지원사님 또는 동료와 지인들이 해 주던 일을 대신해 주는, 그리고 앞으로 더 많이 대신해 줄 ‘음성 비서’라고 할 수 있죠. 저는 수업 자료를 준비할 때, 인터넷 기사를 읽을 때, 블로그에 글을 쓸 때도 AI 음성을 자주 사용합니다. 그러다 보니 자연스럽게 음성의 품질은 저에게 매우 중요한 부분이 되었는데요.

오늘은 제 삶의 질과도 깊이 관련된다고 할 수 있는 대표적인 AI 음성 서비스들을 소개해 드리겠습니다! 본격적으로 살펴 볼까요? 🎯


1️⃣ 구글 제미나이 라이브: 생동감 넘치는 AI 친구

음성 품질: ⭐⭐⭐⭐⭐

제미나이(Gemini) 라이브의 영어 음성은 자연스러울 뿐 아니라 자꾸 대화하고 싶어지게 만드는 매력이 있습니다. 속도, 억양, 톤이 모두 자연스럽고 고를 수 있는 고퀄리티 음성도 10가지나 되죠. 저는 종종 자기 전에 미국 액센트와 영국 액센트를 오가며 이런저런 주제로 대화하는데 영어 회화 연습에 좋습니다. 아쉬운 것은 아직은 자연스러운 음성을 지원하는 언어에 한국어가 추가되지 않았다는 점이에요. 지금은 언제든 대화할 수 있는 영어 원어민 친구 정도로 생각하면 좋을 것 같아요!

  -> 이 포스팅을 올린 후 며칠 지나지 않아 제미나이에서 한국어도 자연스러운 음성 지원이 추가된 것을 확인했어요. 이제 한국어로도 자연스러운 음성을 사용하실 수 있습니다!

💡 꿀팁: iOS 앱과 안드로이드 앱에서 사용할 수 있습니다. 시각장애인의 경우 한소네 6에서도 구글 음성 비서로 설정해 사용할 수 있습니다!


2️⃣ 마이크로소프트 코파일럿: 감성적인 AI 대화의 정수

음성 품질: ⭐⭐⭐⭐⭐

코파일럿(Copilot)의 영어 음성은 특유의 부드러움이 있습니다. 마치 라디오 DJ와 대화하는 것 같은 느낌이죠. 저는 개인적으로 새로운 음성을 발견하면 아내 유정에게 이런저런 음성을 들려주는데요, 유정이 유독 이 목소리에는 호감을 표현하더라고요. 특히 기분이 조금 꿀꿀할 때 들으면 나아지는 그런 음색입니다. 이 음성 역시 영어로만 제공되며 기기의 사용 언어를 영어로 설정해 두어야만 활성화된다는 점은 아쉬운 점입니다.

🔧 활용 팁: 코파일럿 앱은 Copilot Daily라는 기능을 제공하는데요. 기기가 영어로 설정된 경우 해당 액센트의 국가와 관련된 뉴스를 매일 짤막하게 전해 줍니다. 감미로운 AI 뉴스 브리핑인 셈이죠!


3️⃣ 챗GPT 음성 대화 모드: 올라운더 챔피언

음성 품질: ⭐⭐⭐⭐⭐

챗GPT의 음성 대화 모드(advanced voice mode)는 제가 가장 많이 사용하는 챗봇 서비스 중 하나입니다. 다양한 음성 중에서도 Cove 음성이 제일 매력적인데 요즘엔 Vale 음성의 영국 액센트도 마음에 들어서 자주 씁니다. 챗GPT 음성의 가장 놀라운 점은 빠른 반응 속도와 다국어 지원이 자연스럽다는 점인데요. 얼마 전에는 간단한 프랑스어 표현을 배우는 데 써 봤는데 매우 편했습니다. 물론, 챗GPT의 방대한 지식과 높은 추론 능력 덕분에 전문적인 주제로도 막힘 없이 대화할 수 있습니다.

💪 활용 사례: 아이폰의 경우 단축어(Shortcuts) 기능을 활용해서 ‘음성 대화 시작’ 아이콘을 홈 화면에 놓고 사용하면 편합니다. 또 데스크톱 앱을 사용하면 PC에서 브라우저를 통하지 않더라도 빠르게 챗GPT를 호출할 수 있는데요. 저는 학교에서 학생들과 수업할 때 데스크톱 앱을 사용해서 학생들에게 들려주기도 합니다.


4️⃣ 흄 AI: 감정을 담은 AI 음성의 새로운 지평

음성 품질: ⭐⭐⭐⭐

흄(Hume) AI의 특별한 점은 감정 표현입니다. 기쁨, 슬픔, 놀람 등 다양한 감정을 자연스럽게 표현할 수 있어요. 다만 반응 속도가 조금 느린 것과 한국어 지원이 안 된다는 점은 아쉽습니다.

🎭 특별 기능: 감정 분석과 음성을 결합한 독특한 경험을 제공합니다.


5️⃣ 스피치파이: 프리미엄 음성의 정석

음성 품질: ⭐⭐⭐⭐⭐

스피치파이(Speechify)는 이 리스트에 있는 서비스 중 유일하게 보조 기술을 표방합니다. 실제로 저도 일상에서 가장 많이 쓰는 서비스이죠. 정말 고급스러운 음성 품질과 높은 사용성을 자랑합니다. 유명인의 목소리를 포함해서 다양한 음성을 선택할 수 있다는 점이 매력적이죠. 하지만 무엇보다도 Chrome 확장 프로그램 등 모든 플랫폼에서 사용할 수 있다는 것이 가장 큰 장점입니다. 글로벌 TTS 서비스 가운데 드물게 한국어 음성도 양질의 음성을 선택할 수 있어서 좋습니다.

💰 가격 팁: 구독료가 비싼 편인데 다국어 문서를 많이 읽거나 난독증 등 특별한 요구가 있다면 아깝지 않습니다. 연간 구독시 할인율이 큰 편이니 참고하세요.


6️⃣ 일레븐랩스: 혁신적인 음성 기술의 선두주자

음성 품질: ⭐⭐⭐⭐⭐

일레븐랩스(ElevenLabs)는 현재 AI 음성 기술의 최전선을 보여주는 서비스입니다. 마치 전문 성우가 녹음한 것 같은 깔끔한 발음과 자연스러운 억양이 인상적입니다. 최근에는 GenFM이라는 팟캐스트 생성 서비스를 선보일 만큼 뛰어난 기술력을 자랑하죠. 제가 이 블로그에 탑재하는 AI 음성도 일레븐랩스를 통해 생성합니다. 수많은 언어와 다양한 음성을 활용할 수 있고 나의 음성을 복제할 수도 있죠. 음성 콘텐츠 생성에는 필수적인 서비스입니다.

🛠️ 전문가 팁: 프로젝트 등 다양한 기능을 사용하시면 전문적 도구로 사용할 수 있습니다. 취미 목적이라면 iOS 앱과 안드로이드 앱으로 다양한 콘텐츠를 즐기는 것도 좋은 사용법입니다.


7️⃣ 에이닷 음성모드: 한국어 챗봇의 자존심

음성 품질: ⭐⭐⭐⭐

에이닷은 한국어 AI 음성 중에서는 단연 최고입니다. 특히 위치 정보를 기반으로 한 날씨와 맛집 검색과 같은 대화가 가능합니다. 저는 AI 스피커가 근처에 없을 때 종종 유용하게 사용합니다. 가끔 심심풀이 대화도 하는데 글로벌 챗봇에 비해서는 추론 능력이 떨어지지만 일반적인 AI 스피커보다는 긴 대화를 이어갈 수 있습니다.

🌟 활용 팁: 위치 서비스를 켜두면 더 정확한 맛집, 날씨, 교통 정보 등을 받을 수 있습니다.


8️⃣ 네이버 클로바: 친근한 AI 비서

음성 품질: ⭐⭐⭐⭐

클로바의 장점은 한국어에 특화된 자연스러운 발음과 스마트홈 연동입니다. 유인나 음성은 특유의 친근함이 있어서 좋더라고요. 저희 집에서는 주로 IoT 기기 제어에 사용하는데, “보일러 온도 1도 높여 줘”, “TV 꺼 줘” 같은 명령을 하면 아주 충실하게 실행해 줍니다. 특히 캘린더 서비스와도 연동이 되어서 일정도 쉽게 음성으로 확인할 수 있습니다.

🏠 활용 사례: AI 스피커가 없어도 모바일 앱으로 스피커의 모든 기능을 사용할 수 있습니다. 또한 구글 네스트 등 타사 제품과 함께 사용하면 일상에서 더욱 풍부하게 음성 비서 서비스를 즐길 수 있습니다.


9️⃣ 펄플렉시티 음성으로 질문하기: 음성 검색의 미래

음성 품질: ⭐⭐⭐⭐

펄플렉시티(Perplexity)는 AI 검색 엔진과 음성 인터페이스를 결합한 독특한 서비스입니다. 한국어와 영어 모두 자연스러운 음성을 제공하고, 다른 챗봇과 달리 핵심만 콕콕 집어서 알려주죠. 특히 버튼을 길게 누르고 질문한 뒤 손가락을 떼면 바로 대답해주는 직관적인 인터페이스가 매력적입니다.

🔍 활용 팁: 궁금한 게 있을 때 빠르게 찾아보기 좋습니다. 다만 여러 언어를 사용하신다면 음성 인식 언어를 미리 설정해두세요.


1️⃣0️⃣ 마이크로소프트 Edge: 숨은 보석 같은 존재

음성 품질: ⭐⭐⭐⭐⭐

Edge 브라우저의 ‘소리내어 읽기’ 기능은 정말 놀라운 발견이었습니다. 특히 한국어 ‘현수’ 음성은 다른 어느 서비스에서도 찾을 수 없는 최고의 품질을 자랑해요. 저는 학교에서 인터넷 기사를 학생들에게 보여줄 때 항상 이 기능을 사용합니다. 특히 음성이 읽어주는 위치를 시각적으로도 함께 따라가며 하이라이팅해 주기 때문에 마치 누군가가 옆에서 손가락으로 짚으며 읽어주는 것 같은 느낌입니다. 다만 브라우저를 통해서만 사용할 수 있다는 제약이 있어요.

📚 활용 팁: 스마트폰에서도 기본 브라우저로 설정하면 ‘읽기 모드’, ‘코파일럿’ 등 엣지의 다른 유용한 기능과 함께 사용할 수 있습니다.


🎯 나만의 활용 시나리오: AI 음성과 함께하는 하루


AI 음성 서비스 정말 다양하죠? 저는 매일 아침부터 저녁까지, 이렇게 활용하고 있습니다.


  • 🌤️ 아침 날씨는 에이닷으로 체크
  • 😊 수업 준비와 전문적인 수다 떨기는 챗GPT AVM과 함께
  • 📚 학생들과 긴 웹 문서는 엣지의 시각 하이라이팅 기능으로
  • 🎙️ 블로그용 오디오 콘텐츠는 일레븐랩스의 전문적인 음성으로
  • 🌐 일상적인 웹 서핑과 읽기는 스피치파이로 자유롭게
  • 🔍 궁금한 것이 생기면 펄플렉시티로 빠르게 검색
  • 🏠 집에서는 클로바로 스마트홈 제어하며 편하게
  • 🤗 기분이 울적할 땐 코파일럿의 부드러운 목소리로 위로받기
  • 🎭 감성적인 대화가 필요할 땐 흄 AI의 다채로운 감정 표현으로
  • 💬 자기 전 영어 회화 연습은 제미나이와 함께


💭 마치며


AI 음성 기술은 계속해서 발전하고 있습니다. 특히 장애인의 관점에서 보면, 이러한 발전은 정보 접근성을 크게 향상시키고 있죠. 인간-컴퓨터 상호작용(HCI) 분야에서 AI 음성은 핵심적인 역할을 하기 때문에 앞으로도 계속된 투자가 이루어질 것으로 예상됩니다.

물론, 아직은 AI 음성 서비스의 한계도 명확하죠. 당장 챗GPT만 하더라도 음성 대화 모드에서는 실시간 검색이 되지 않는 기술적 한계가 존재하니까요. 또 하나의 허들은 비용인데요. AI 음성과 관련된 많은 서비스가 유료로 제공되고 있습니다. 개별적으로 보면 점차 비용이 낮아진다고 볼 수 있지만 서비스가 다양화되면서 전체적으로는 소비자에게 부담이 커지는 구조입니다. 만약 AI 음성 서비스를 정보 취약 계층을 위한 디지털 포용의 관점에서 접근한다면 관련된 법적 근거와 정책 마련도 고민해 볼 수 있겠지요.

하지만 이 모두에 앞서 이러한 미래 기술을 적극적으로 사용해 보면서 우리의 현재에서 유용한 활용 사례를 찾는 것이 우선일 것입니다. 그런 의미에서 여러분은 어떤 AI 음성 서비스를 사용하고 계신가요? 

이 글에 대한 의견이나 질문이 있으시다면 댓글로 남겨주세요! 🙋‍♂️ 함께 이야기 나누면서 좋은 정보를 많이 공유할 수 있었으면 좋겠습니다. 🎧🗣️

🔍 👀 검색 엔진도 시각장애인처럼 웹을 탐색한다: HTML 구조화가 중요한 이유

AI 음성으로 듣기 - ElevenLabs


매일 아침 PC나 아이폰의 스크린 리더를 사용해서 뉴스를 읽을 때마다 저는 한숨부터 나옵니다. 보통 외국 사이트는 그렇지 않지만 국내 사이트들은 헤딩 태그가 뒤죽박죽이거나 아예 빠져있는 경우가 허다하기 때문이죠. 심지어 한겨레, 조선일보와 같은 메이저 언론사, 네이버 블로그처럼 콘텐츠 노출이 생명인 플랫폼도 HTML이 엉망입니다.

🌟 눈에는 보이지 않지만 중요한 HTML

겉으로 보기에 아름다운 웹사이트도 HTML이 제대로 구조화되지 않았다면, 마치 체계는 없고 내용만 가득한 책과 같습니다. 겉모습은 그럴듯해도, 목차도 없고 장절 구분도 없어서 원하는 내용을 찾기 힘든 그런 책 말이죠. 그럼 HTML은 무엇일까요?

HTML(HyperText Markup Language)은 웹페이지의 콘텐츠에 의미를 부여하는 마크업 언어입니다. 우리가 보는 모든 웹페이지는 이 HTML을 통해 콘텐츠의 구조와 의미가 정의됩니다. 마치 잘 정리된 책이 목차, 장, 절, 각주 등으로 구성되어 있듯이, 웹페이지도 HTML로 콘텐츠의 의미 구조를 정의하죠.

Chrome과 같은 웹 브라우저는 이 HTML 코드를 읽어 우리가 보는 화면으로 변환합니다. HTML은 "이건 제목이야", "이건 문단이야", "이건 이미지야" 하는 식으로 콘텐츠의 의미를 알려주는 역할을 합니다.

그런데 문제는 많은 웹사이트들이 이 HTML을 의미론적으로 제대로 작성하지 않습니다. 마치 책을 쓰면서 목차도 없고, 장절 구분도 없이, 그저 텍스트만 나열해놓은 것과 비슷하죠. 그러면 겉보기에는 멀쩡해 보여도 실제로는 콘텐츠의 구조와 의미가 제대로 전달되지 않습니다. 예를 들어 화면상으로는 제목처럼 보이지만 HTML 상에서는 단순한 텍스트로만 처리되어 있거나, 중요한 이미지인데 그 의미를 설명하는 대체텍스트가 없는 식이죠. 이것은 생각보다 심각한 문제입니다.

🎯 왜 HTML 구조가 중요할까요?

저는 그동안 HTML은 스크린 리더를 사용하는 시각장애인에게만 중요한 줄 알았습니다. 그런데 웹 접근성을 계속 공부하면서 HTML의 가치가 상업적인 데에도 있다는 것을 깨달았습니다. 자세히 설명해 보겠습니다.

1. 장애인의 접근성을 높여 줍니다!

네, 물론 장애인에게 진짜 중요합니다. 우리가 길을 걸을 때 도로 표지판이나 신호등이 필요하듯, 디지털 공간을 탐색하는 장애인에게는 잘 구조화된 HTML이 필요합니다. 시각장애인의 스크린 리더는 이 구조를 따라 콘텐츠를 논리적으로 읽어주고, 키보드 사용자는 순차적으로 페이지를 탐색할 수 있습니다. 또한 인지장애가 있는 사용자들도 체계적으로 구성된 정보를 통해 콘텐츠를 더 쉽게 이해할 수 있죠.

2. 검색 엔진 최적화에 도움이 됩니다!

놀라운 것은 두 번째 이유입니다. 검색 엔진도 마치 시각장애인처럼 웹사이트를 읽어나간다는 것입니다. 검색 엔진의 크롤러(crawler)는 HTML의 의미 구조를 따라 콘텐츠를 탐색합니다. 제목 태그를 통해 글의 중요도와 구조를 파악하고, 이미지의 대체텍스트를 읽어 시각 정보를 이해합니다. 마치 스크린 리더를 사용하는 시각장애인이 웹사이트를 탐색하는 것과 똑같은 방식이죠.

따라서 HTML 구조화가 잘 되어 있는 웹사이트는 검색 엔진이 더 쉽게 이해하고 검색 결과 상단에 노출하게 됩니다. 이렇게 검색 엔진이 선호하는 방식으로 웹사이트를 구축하는 것을 검색 엔진 최적화(Search Engine Optimization), 줄여서 SEO라고 합니다.

콘텐츠 노출이 생존과 직결되는 언론사나 블로그 플랫폼에서는 그래서 이 HTML 구조화가 특히 중요합니다. 그런데 아이러니하게도, 검색 엔진 노출이 생명인 미디어 업계조차 이런 기본적인 SEO 전략을 놓치고 있다니 안타까울 따름입니다.

💡 HTML 구조를 잘 만드는 방법

웹 개발자가 접근성과 검색 엔진 최적화를 모두 고려한 웹사이트를 만들기 위해서는 다음과 같은 기본적인 HTML 구조화 원칙들을 꼭 지켜야 합니다.

1. 헤딩 태그(H1~H6)를 논리적으로 사용하세요

  • 페이지의 주요 제목은 반드시 H1으로 시작하세요.
  • 하위 제목들은 순차적으로 H2, H3를 사용합니다.
  • 계층 구조를 뛰어넘지 마세요. (예: H1 다음에 H4를 쓰는 것은 피해야 합니다)

2. 의미 있는 대체텍스트를 작성하세요

  • 이미지가 전달하는 핵심 정보를 간단명료하게 설명하세요.
  • 잘못된 예: "image_001.jpg", "사진", "배너"
    올바른 예: "2024년 웹 접근성 컨퍼런스에서 발표 중인 김헌용 교사"
  • 장식용 이미지는 빈 대체텍스트로 처리하세요.
  • 복잡한 차트나 그래프는 자세한 설명을 제공하세요.

    예: "2020년부터 2024년까지의 웹 접근성 준수율 그래프. 2020년 45%에서 시작해 매년 10%씩 증가하여 2024년에는 85%를 달성함"

3. 메타 데이터 최적화하기

  • 페이지 제목과 설명을 명확하게 작성하세요.
  • 잘못된 예:
    제목: "블로그 글"
    설명: "웹 접근성에 대한 글입니다."

    올바른 예:
    제목: "검색 엔진도 시각장애인처럼 웹을 탐색한다: HTML 구조화가 중요한 이유"
    설명: "HTML 구조화가 웹 접근성과 검색 엔진 최적화(SEO)에 미치는 영향을 시각장애인 교사의 관점에서 설명합니다. 헤딩 태그와 대체텍스트의 중요성을 실제 사례와 함께 다룹니다."
  • 핵심 키워드를 자연스럽게 포함하세요.
  • 잘못된 예: "웹접근성,HTML,SEO,장애인,검색엔진최적화,홈페이지제작"
    올바른 예: "웹 접근성과 SEO의 상관관계: HTML 구조화의 중요성"
  • 각 페이지마다 고유한 메타 정보를 제공하세요. 여러 페이지에 동일한 제목이나 설명을 사용하면 검색 엔진이 혼란스러워할 수 있습니다.

이러한 원칙들은 단순해 보이지만, 실제 현장에서는 자주 간과됩니다. 하지만 이 기본적인 HTML 구조화 작업만 제대로 해도 웹사이트의 접근성과 검색 엔진 최적화 수준을 크게 높일 수 있습니다.

✨ 마무리하며

웹 접근성과 검색 엔진 최적화는 얼핏 전혀 다른 이야기처럼 보입니다. 소수의 장애인을 위한 배려와 비즈니스의 성공을 위한 기술이 서로 관련성이 없는 것처럼 보이니까요. 하지만 HTML이라는 렌즈를 통해 들여다보면, 이 둘은 놀랍도록 비슷한 원리로 작동합니다.

검색 엔진이 시각장애인처럼 웹사이트를 탐색한다는 사실 놀랍지 않나요? 제가 시각장애인으로서 매일 경험하는 웹의 불편함이, 사실은 검색 엔진도 겪고 있는 어려움이었다니! 이 또한 접근성이 더 이상 ‘특별한 배려’가 아니라 '보편적 원칙'이 되어야 하는 이유입니다. :)

[후기] “오늘을 대담하게, 내일을 가능하게”, 반가웠던 LG전자 접근성 커뮤니티 ‘볼드무브’ 첫 모임

AI 음성으로 듣기 - ElevenLabs


LG전자와 사단법인 무의가 함께 만든 접근성 커뮤니티 ‘볼드무브’의 첫 모임에 다녀왔다.

 

‘볼드무브’는 ‘Bold Today, Possible Tomorrow(오늘을 대담하게, 내일을 가능하게)’라는 슬로건으로 장애인 사용자들이 일상에서 마주하는 불편함을 해소하고, 실제 제품 개선 아이디어까지 창출할 목적으로 LG전자가 기획한 프로그램이다. LG전자는 ‘모두를 위한 가전’을 표방하며 이 블로그에서도 소개한 적 있는 촉각 스티커를 비롯해 장애인 사용자를 위한 혁신적 도구들을 ‘컴포트 키트’라는 이름으로 개발해왔다. 여기에 ‘모두의 1층’, ‘휠체어로 성수 완전정복 지도’ 개발 등 늘 상상을 뛰어넘는 장애인 이동권 프로젝트를 수행해온 무의가 만났으니, 이보다 더 기대되는 협업 프로젝트도 드물 것 같다!


[첫 모임 단체 사진] 빨간색과 흰색의 볼드무브 배경 현수막 앞에서 8명의 참가자들이 다양한 포즈로 활기차게 서 있다. 앞줄에는 휠체어를 사용하는 4명의 참가자가 나란히 앉아 각각 밝은 미소와 함께 손팻말을 들고 있다. 한 참가자는 ‘BOLD MOVE’ 피켓을 들고 있고, 다른 참가자는 ‘오늘을 대담하게, 내일을 가능하게’라는 문구가 적힌 피켓을 들어 보이고 있다. 뒷줄에는 서 있는 4명의 참가자들이 수어로 ‘LG’ 모양을 만들어 볼드무브의 정신을 표현하며 환하게 웃고 있다. 참가자들의 생동감 넘치는 포즈와 따뜻한 표정, 나무 천장에서 내려오는 부드러운 조명이 어우러져 화기애애하고 활기찬 분위기를 느낄 수 있다.

  - Described by ChatGPT

 

앞으로 나를 포함한 10여 명의 1기 볼드무버들은 3개월 동안 가전제품을 통해 ‘나다움’을 발견하고, 접근성을 높일 방법을 직접 고민하고 실행에 옮길 예정이다. 오늘은 바로 그 첫 모임이었다. 장소는 늘 갈 때마다 정말 무언가가 변하고 있다는 설렘을 주는 헤이그라운드 성수시작점이었다.

 

첫 모임에서는 머니투데이 남형도 기자의 ‘나만의 이야기를세상에 용기 있게 전하는 법’이라는 주제의 강연을 듣고, ‘나다움 발견하기’ 워크숍을 통해 각자의 이야기를 나누었다. 진행은 스토리 소사이어티의 채자영 대표님이 해 주셨는데 처음 뵙는 분이지만 기분 좋은 에너지가 전달되었다. 인상적인 것은 시각장애인 참가자들을 위해 자신의 외모와 인상착의를 먼저 설명하고 시작했다는 점이었다.

 

“저는 167cm 정도의 키이고 오늘의 분위기에 맞게 블랙 자켓과 블랙 바지를 입었습니다.”

 

이런 상세한 시각적 설명은 이후 모든 발표자들이 공통적으로 해주셨는데 주최 측의 섬세한 준비가 빛나는 대목이었다.

 

저녁 식사를 마치고 본격적인 워크숍이 시작됐다. 첫 순서는 남형도 기자님의 강연이었다.

 

남형도 기자님은 강연 내용에 앞서 실제로 만났다는 것부터가 참 반가웠다. 남 기자님은 2010년 데뷔 이후 본인만의 독특한 취재·보도 방식인 ‘체헐리즘’을 개척해오셨는데 사실 장애인 커뮤니티에서는 이미 잘 알려진 분이다. 특히 시각장애인의 관점에서 쓴 벚꽃 축제 체험기는 당사자들 사이에서 큰 공감을 얻었던 기사이다. 그런 기자가 어떤 동기와 과정을 거쳐 기사를 쓰게 되는지 들을 수 있는 귀한 시간이었다. “대학 시절 쓰레기를 치우시는 여사님이 쓰레기통에 앉아 쉬시는 모습을 보고 기자가 되기로 결심했다”는 말씀이 특히 기억에 남는다. 그 순간이 기자님에게 얼마나 상징적인 경험이었을지 상상해 보았다. 가끔은 하나의 결정적인 순간이 인생을 바꾸기도 한다.

 

이어진 ‘나다움 발견하기’ 워크숍은 재미있는 발견들의 연속이었다. 우선 나를 표현하는 세 가지 키워드를 고르는 과정에서 뜻밖의 단어를 발견했다. 내가 애용하는 AI 비서 Claude와 함께 고민한 끝에 ‘실천적’이라는 단어를 선택했는데, 가전제품 접근성 개선을 위해 그동안 이런저런 시도를 해온 내 모습이 잘 담긴 것 같아 마음에 들었다.

 

다른 참가자들의 이야기도 흥미진진했다. 노하우를 공유하는 시간에는 유튜버 ‘구르님’ 김지우님이 집 안 곳곳에 IoT 기기를 설치해 스탠드 같은 제품을 음성으로 제어한다고 했는데, 나도 스마트홈 기술에 관심이 많은 사람으로서 나중에 심도 있는 얘기를 해 보고 싶어졌다. 정원희님이 제안한 ‘세척 없는 가습기’는 당장 어제 가습기를 꺼내 대충 세척하고 쓰고 있는 터라 뜨끔하면서도 정말 공감되는 아이디어였다.

 

‘슈리우스’ 채널을 운영하는 김필우님은 시각장애인이면서도 패션, 특히 신발 리뷰를 전문으로 하는데 최근 육아로 1년 정도 콘텐트를 업로드 못하고 있다는 말에 왠지 짠했다. 개인적으로 아는 지인이어서 가끔 집에 놀러가기도 하는데 벽 한쪽을 가득 채운 신발들은 잘 지내고 있을까? 100만 구독자 유튜버 ‘원샷한솔’ 김한솔님의 이야기도 원래 알고 있었지만 인상적이었다. 삼양식품과 협업해 개발한 점자 표기 컵라면 덕분에 나도 종종 도움을 받는데 이런 좋은 사례가 이번 ‘볼드무브’ 커뮤니티에도 이어지면 좋겠단 생각이 들었다.

 

남들에게 들려주고 싶은 이야기를 발표하는 세션에서는 특히 정미나님의 솔직한 이야기가 마음에 와닿았다. “나는 어려워도 잘산다는 것을 보여주고 싶다.”는 말이었다. 장애와 함께 산다는 건 33년이나 함께 살아온 나도 여전히 익숙해지기 어려운 일이다. 가끔은 내다버리고 싶을 때도 있지만, 동시에 이것이 나이기에 긍정하고 싶고 남들에겐 잘 살고 있다는 걸 보여주고 싶은 마음도 크다. 이런 복합적 감정은 장애가 있는 사람이라면 누구나 공감할 것이다. 이런 커뮤니티 활동을 하다 보면 그래도 문득 화해의 순간이 찾아온다. 우리의 존재가 세상의 변화를 이끌어내는 원동력이 될 때가 바로 그 때다. 그럴 땐 내 장애가, 아니 그걸 더 나은 것으로 승화시킨 내가 대견스러워지는 것이다. ‘볼드무브’도 그런 경험이 되리라 확신한다.

 

처음에는 ‘나다움 발견하기’라는 주제가 다소 유치하게 느껴지기도 했고, 20대 때 참여했던 ‘장애청년 드림팀’이 떠올라서 왠지 향수에 젖기도 했다. 하지만 막상 활동을 하다 보니 나 자신에 대해, 그리고 장애에 대해 오랜만에 다양한 관점에서 생각해볼 수 있었다. 장애는 종종 꺼내보지 않으면 어느새 나를 규정하는 족쇄처럼 느껴지기 마련이다. 그래서 이런 활동들은 늘 의미가 있다.

 

마지막으로 오늘의 꿀잼은 나와 동행해 준 유정과 도도였다. 특히 도도는 행사 내내 귀여운 옹알이를 하며 행사장의 분위기를 밝게 만들어 주었다. 헤이그라운드는 서울에서도 접근성이 잘 갖추어진 곳으로 손에 꼽히는 베뉴라 꼭 도도를 유아차에 태우고 데리고 가고 싶었다. 게다가 오늘의 모임은 다양성과 포용성을 이야기하는 곳이니까 더더욱 걱정이 없었다. 기대대로 모두들 우리 가족을 반갑게 맞아주어 넘 감사했다.


   

[볼드무브 로고 앞에서] 따뜻한 실내 조명 아래, 대형 디스플레이에는 여러 손이 하나로 모이는 볼드무브의 상징적인 이미지가 떠 있다. 그 앞에 체크무늬 코트를 입은 나와 회색 우주복 같은 따뜻한 옷을 입은 도도가 있다. 도도는 유아차에 앉아 호기심 어린 눈빛으로 주변을 살피고 있고, 나는 그런 도도를 바라보며 살짝 미소 짓고 있다.

  - Described by Claude


이런 사회적 의미를 담은 행사일수록 내용만큼이나 형식과 바이브가 중요하다. 감히 평하건대 이번 워크숍은 내용, 형식, 바이브를 모두 잡은 기분 좋은 시작이었다. 다음 주에는 ‘나다운 챌린지’를 선언하는 시간을 갖는다고 한다. 어떤 도전적인 아이디어가 오갈지, 또 어떤 통찰을 얻게 될지 기대된다. 나 역시 그동안의 경험을 살려 의미 있는 아이디어를 제안하고 싶다.


* 관련 글: [후기] LG전자가 개발한 작지만 중요한 아이템, 점자 스티커 - 시각장애인 사용자라면 꼭 설치하세요. (워시타워 작동 영상 포함)

[팁] 아이폰 단축어(Shortcuts)로 챗GPT 음성 대화 모드 더 간편하게 시작하기

AI 음성으로 듣기 - ElevenLabs


챗GPT의 고급 음성 대화 모드가 많은 호평을 받고 있습니다. 특히 시각장애인 사용자들에게는 높은 접근성으로 더욱 유용한 기능인데요. 오늘은 아이폰의 단축어 기능을 활용해 챗GPT의 음성 대화 모드를 더욱 편리하게 사용하는 방법을 소개하려고 합니다.

왜 단축어를 사용해야 할까요?

챗GPT 앱에서 음성 대화를 시작하려면 여러 단계를 거쳐야 합니다. 앱을 실행하고, 음성 대화 버튼을 찾아 누르는 과정이 필요하죠. 하지만 단축어를 사용하면 홈 화면에서 한 번의 탭으로 바로 음성 대화를 시작할 수 있습니다.

단축어 설정 방법 (보이스오버 사용 환경 기준)

  1. 아이폰에 기본 설치된 '단축어(Shortcuts)' 앱을 실행합니다. (앱을 찾기 어렵다면 설정 앱에서 '단축어'를 검색해도 됩니다.)
  2. 단축어의 홈 화면으로 이동합니다.
  3. '앱 단축어' 헤딩 아래에서 챗GPT를 찾아 선택합니다.
  4. 'Start voice conversation' 항목을 더블 탭한 후 길게 누릅니다.
  5. 팝업 메뉴에서 '홈 화면에 추가'를 선택합니다.

활용 팁

  • 독(Dock)에 넣어두면 어느 화면에서든 빠르게 접근할 수 있습니다.
  • 기본 이름인 'Start voice conversation' 대신 원하는 이름으로 변경할 수 있습니다. (예: "GPT 음성 대화" 등)
  • 자동화 기능과 결합하여 특정 시간이나 상황에서 자동으로 음성 대화가 시작되도록 설정할 수 있습니다. (예: 아침에 일어났을 때 일정 체크하기, 취침 전 일기 쓰기 등)

다른 유용한 단축어 활용 사례

아이폰의 단축어 기능은 챗GPT 외에도 다양한 앱에서 활용할 수 있습니다. 예를 들어 볼게요.

  • 음성 메모 바로 시작하기
  • 자주 연락하는 사람에게 빠르게 전화하기 (저는 활동지원사님에게 전화 걸기를 단축어로 추가했습니다!)
  • 특정 앱의 특정 기능 바로 실행하기 (저는 Be My Eyes 앱에서 봉사자에게 전화 걸기를 단축어로 추가했습니다!)
  • 자주 사용하는 설정 토글하기

특히 미국의 주요 앱들은 대부분 단축어 기능을 제공하고 있어, 이를 활용하면 스마트폰 사용 경험을 한층 더 효율적으로 만들 수 있습니다.

마치며

단축어는 단순한 바로가기 이상의 가치가 있습니다. 특히 보이스오버 사용자에게는 앱 접근성을 크게 향상시켜주는 도구가 될 수 있습니다. 챗GPT의 음성 대화 모드를 시작으로, 다른 유용한 단축어들도 찾아보시면서 여러분만의 효율적인 스마트폰 사용 환경을 만들어보시기 바랍니다.