데이터 리터러시는 AI 시대의 필수 기본기이며 이를 갖춘 사람만이 AI를 제대로 활용할 수 있습니다.
빅데이터가 AI의 인프라로 자리 잡으면서, 이제 우리는 ‘데이터를 어떻게 쌓을 것인가’에서 ‘데이터를 어떻게 읽고 활용할 것인가’로 관심사가 이동하고 있습니다. 데이터가 너무나 당연한 존재가 되어버린 지금, 중요한 것은 데이터를 제대로 이해하고 해석할 수 있는 능력입니다. 과거에 글을 읽고 쓸 줄 아는 것이 문해력(literacy)이었다면, 지금은 데이터를 읽고 쓸 줄 아는 현대적인 문해력이 필요하다 할 수 있습니다.
데이터 리터러시의 영역은 크게 아래의 네가지로 나누어집니다.
- 읽기(Reading) – 표, 그래프, 차트를 정확하게 해석하기
- 작업하기(Working) – 데이터를 정제하고, 필터링하고, 변환하기
- 분석하기(Analyzing) – 데이터 속에서 패턴과 인사이트 발견하기
- 소통하기(Communicating) – 데이터 기반 인사이트를 다른 사람에게 명확히 전달하기
태블로와 와 Forrester Consulting이 10개국 2,000여 명의 의사 결정권자를 대상으로 한 설문조사에 따르면, 데이터 리터러시와 기술 향상에 적절한 규모로 투자하는 조직(특히 어느 정도 성숙한 이니셔티브를 추진하는 조직)은 의사 결정, 혁신, 생산성, 고객 및 직원 경험 등이 개선되는 강력한 이점을 경험하는 것으로 나타났습니다.

여기서 주목할 점은 리더들은 직원들에게 데이터 기술을 제공한다고 생각하지만, 실제로 직원들이 체감하는 교육 수준은 그에 미치지 못한다는 것입니다. 리더의 기대(79%)와 직원의 실제 경험(40%) 사이에는 거의 두 배에 가까운 간극이 존재합니다. 이는 데이터 리터러시 교육이 단순히 도구 사용법을 알려주는 것을 넘어, 직원들이 실제로 데이터를 읽고 해석하며 의사결정에 활용할 수 있도록 체계적으로 설계되어야 함을 의미합니다
AI 시대에서 데이터 리터러시가 왜 지금 더 중요한가?
과거 빅데이터 시대에는 데이터 엔지니어, 데이터 과학자 같은 전문가들이 데이터를 다루는 주체였습니다. 하지만 기술의 발전으로 데이터 민주화의 시대가 도래하고, AI 도구 또한 대중화되면서 상황이 완전히 바뀌었습니다. 이제는 마케터도, 영업 담당자도, 기획자도 LLM과 태블로 같은 BI 플랫폼을 통해 데이터를 직접 다룹니다. 문제는 접근성이 높아졌지만, 데이터를 제대로 읽고 해석하는 능력은 여전히 부족하다는 점에 있습니다.
AI에게 좋은 질문을 던지는 능력은 데이터 리터러시와 본질적으로 같은 뿌리를 가지고 있습니다. 이는 단순히 숫자를 읽는 것이 아니라, 어떤 데이터가 필요한지, 그 데이터가 무엇을 말해줄 수 있고 무엇을 말해줄 수 없는지를 구별하는 능력입니다. “매출 분석해줘”라는 질문을 하는 사람보다 “지난 6개월간 카테고리별 매출을 프로모션 기간과 비교해줘”라고 요청하는 사람이 데이터의 구조, 변수, 맥락을 이해하고 있기 때문에 더 유용한 결과물을 이끌어 낼 수 있습니다. 데이터 리터러시가 높은 사람일수록 AI에게 더 정확한 맥락과 조건을 제시할 수 있고 훨씬 더 유용한 인사이트를 끌어낼 수 있습니다.
빅테크 기업(OpenAI, Google 등) 입장에서 전 세계 수억 명의 질문에 매번 최고의 품질로 응답하는 것은 불가능에 가깝습니다. 만약 AI가 모든 질문에 대해 스스로 논리를 검토하고, 팩트를 체크하며, 여러번 고쳐 쓴 뒤 답변하게 한다면 서버 비용은 수십 배로 뛸 것입니다. 결국, AI는 기본적으로 ‘적은 에너지로 효율적인 답변을 생성하는 모드’로 설정되어 있습니다. AI는 아래의 성질을 가지고 있는데 데이터 리터러시가 높은 사람은 이를 고려하여 도구를 활용할 것입니다.
- 리소스의 ‘개인화’
AI는 특별한 주문이 없으면 가장 적은 연산(에너지)을 써서 답변을 내놓습니다. 질문자는 그 에너지를 끌어다 써야 하는데 “검토해줘”, “단계별로 생각해줘”라는 명령은 AI의 연산 능력을 나에게 더 많이 할당하라는 ‘강력한 리소스 점유 명령’입니다. - ‘확률’모델
AI(LLM)의 본질은 다음에 올 단어를 확률적으로 예측하는 기계입니다. AI는 방대한 텍스트 데이터를 학습하면서 “이 단어 다음에는 어떤 단어가 올 확률이 높은가?”를 계산하는 통계적 패턴 인식 모델입니다. 겉으로 보기에는 마치 논리적으로 사고하는 것처럼 보이지만, 그 내부 메커니즘은 수십억 개의 가중치(weight)로 이루어진 확률 계산에 가깝습니다. - ‘창의성’과 ‘정확성’
모든 사용자가 100%의 정확도만을 원하는 것은 아닙니다. AI가 처음부터 완벽하게(혹은 보수적으로) 답하지 않는 이유는, 사용자가 용도에 따라서 창의적인 영역을 원하는지, 아니면 틀림없는 정확성을 원하는지 잘 모르기 때문입니다. 그래서 AI는 일단 ‘중간 지점’에서 대기하며 사용자의 구체적인 가이드를 기다리는 전략을 취하여 답변을 내놓습니다.
데이터를 읽을 줄 아는 사람은 AI를 활용해 더 나은 결정을 내리고, 그렇지 못한 사람은 AI가 주는 정보를 맹신하거나 잘못 해석하게 될 것입니다. 데이터 리터러시는 전문가만의 영역이 아니라 모든 사람이 갖춰야 할 현대의 기본 문해력입니다. 데이터 리터러시에 대한 관심이 여러분의 업무 방식과 의사결정을 크게 바꿔놓을 것입니다.
지금까지 우리는 데이터 리터러시가 무엇인지, AI의 작동 방식을 이해하는 것이 왜 필수적인지 살펴보았습니다. 다음 글에서는 데이터 리터러시가 있는 사람이 마케팅, 인사, 운영 등에서 얼마나 다른 질문을 던지는지에 대한 예시를 살펴보겠습니다.