Evidence-Linked Labeling: A Verifiable Pipeline for Quantifying Conversational Qualitative Data

Kim, Hyung Chul

doi:10.5281/zenodo.20020776

Chapter 03 · Sample

보니 — 같은 100명의 두 얼굴

Dean Works가 운영하는 육아 코칭 AI 서비스 보니(bonny)의 고객을 모사한 샘플 100명을 구성하고, 이들이 남긴 두 가지 형식의 응답을 수집했다. 왼쪽 목록에서 섹션을 선택하면 데이터 구조·다운로드·대화형/객관식 프리뷰·페르소나 구성을 순차로 확인할 수 있다.

100

세션

~45

평균 turn

세션당

페르소나

Overview

두 데이터셋 한눈에

같은 응답자 100명이 두 가지 형식에 답했다. 대화형 설문 10질문(Base + Tail 프로빙) + 객관식 15문항(SC · MC · 5-Likert · NPS · 짧은 주관식). session_id로 두 데이터셋이 JOIN되므로 같은 사람이 남긴 정형/비정형 응답을 직접 대비할 수 있다.

100

세션

80001~80100

~4,500

대화 turn

평균 45 turn / 세션

객관식 문항

SC · MC · Likert · NPS

페르소나

× 8 자녀 연령 구간

Data Structure

두 데이터셋의 구조

Dataset A · 대화형 설문

~4,500

예상 대화 turn 수

— 100 세션 × 10 질문
— 질문당 AI 3~5턴 + 사용자 답변
— AI는 직전 응답 키워드를 받아서 파고드는 Tail 질문
— CSV 포맷(AI 질문 · 사용자 답변 행 단위)

Dataset B · 객관식 설문

100

응답 행 수 (세션당 1행)

— 15문항 (SC · MC · 5-Likert · NPS · 짧은 주관식)
— 인구통계·사용빈도·만족도·전환·NPS·한 단어
— session_id로 Dataset A와 JOIN
— CSV 포맷(응답자당 1행)

같은 응답자 100명이 두 번 답했다는 것이 이 샘플의 힘이다. 객관식은 Q6 리커트에서 ② 불만족을 택한 사람이, 대화형 설문에서는 “답은 빨리 왔는데 너무 뻔한 소리만 하니까 답답해서 새벽에 혼자 울었어요”라고 말한다. 두 데이터를 같은 화면에 놓으면 객관식의 한 칸이 압축하고 있는 맥락의 부피가 보인다.

샘플은 전적으로 가공 데이터다. 실명·실전화번호는 쓰이지 않았고, 페르소나 카드를 근거로 LLM 생성기가 대화를 직조했다. 생성 스크립트는 공개 가능하며 같은 입력으로 재현할 수 있다.

라벨링 해상도 프리뷰

같은 세션 — 첫 답변만 vs 꼬리 전체, 무엇이 달라지나

P-80001의 Q1(“처음 보니를 만나시게 된 순간”) 한 세트. 같은 응답자·같은 라벨러·같은 폐쇄 어휘 — 입력으로 줄 turn 집합만 바꿨을 때 어떤 축이 사라지고 어떤 라벨이 새로 드러나는지 직접 본다.

First-Turn only · 1 turn

활성 축

총 라벨 수

첫 답변 1건만 라벨러에 투입

Full-Tail · 4 turns

활성 축

총 라벨 수

꼬리 Tail-1·2·3까지 모두 포함

T-80001-01-01· First Turn (첫 답변)

AI처음 보니를 만나시게 된 순간을 떠올려주세요.

새벽 3시쯤이었어요. 애가 백일 전인데 계속 울고 안 자서 저도 한숨도 못 자고 멘붕 와서 핸드폰으로 검색하다가 들어왔어요

em:무력감em:피로bhv:새벽_검색bhv:즉답_요청drv:24시간_즉답cc:수면_야제

T-80001-01-03· Tail Turn (꼬리 답변)

AI그때 남편분은 함께 계셨을까요?

남편은 아침에 출근해야되니까 자고있고.. 깨우기도 미안하고 해서 그냥 혼자 애 안고 거실 왔다갔다 했어요. 근데 애는 계속 울고 저도 울고 있었어요 솔직히

em:고립감em:무력감cc:부부_육아분담

T-80001-01-05· Tail Turn (꼬리 답변)

AI그 순간 검색 말고 다른 선택지는 없으셨어요?

카페는 글 올려도 답변이 몇시간 뒤에나 달리잖아요. 당장 어떻게 해야할지 알아야하는데... 누구라도 당장 답 주는게 필요했어요

bhv:즉답_요청drv:24시간_즉답alt:맘카페

T-80001-01-07· Tail Turn (꼬리 답변)

AI보니가 준 첫 답변이 기억나세요? 어떤 느낌이었는지.

솔직히 답은 바로 왔는데.. 너무 원론적이어서 오히려 더 허무했어요. '배고프거나 졸리거나 불편한 거예요' 이런거요. 그건 저도 알거든요 근데 뭘 해야하는지를 모르니까 물어본건데

em:실망pn:원론적_답변pn:판단_정보_부족

이 세션에서 첫 답변이 놓친 것

pain 축 자체가 사라진다— 원론적_답변·판단_정보_부족은 Tail-3(T-07)에서만 등장. 첫 답변만 보면 이 세션은 ‘pain 없음’.
고립감·부부 육아분담— Tail-1(T-03)에서 드러나는 사회적 맥락. 첫 답변에는 단순 ‘무력감·피로’만 기록된다.
맘카페 대안 채널— Tail-2(T-05)의 alt_channel. 첫 답변에는 ‘핸드폰 검색’이라는 행동만 있을 뿐, 구체 채널명은 없다.

전체 100세션 × 4축 × 11개 인사이트의 누락 비교는 꼬리효과 →에서 확인.

Downloads

전체 파일 다운로드

대화형 설문 원본 CSV
0rows· 0 KB
100세션 · 평균 45턴 · welcome/verify/chat/closing 포함
⤓ 다운로드
객관식 설문 CSV
0rows· 0 KB
15문항 · 세션당 1행 · session_id로 대화형 설문과 JOIN
⤓ 다운로드
세션 메타데이터 JSON
100rows· 42 KB
페르소나·부모 나이대·가구·자녀 연령 (대화형 CSV와 동일 session_id)
⤓ 다운로드
ELL 라벨된 user turn
3,478rows· 2,536 KB
2-Pass 자기검증 완료 · 9축 라벨 · JSONL 스트림
⤓ 다운로드
12 핵심 인사이트 JSON
12rows· 64 KB
claim · derivation · so_what narrative + evidence turn_ids 포함
⤓ 다운로드
토픽 induction 결과
14rows· 256 KB
3-pass · size ≥ 15 필터링 · 3,478 turn 할당 정보
⤓ 다운로드
10% Jaccard QC 보고서
347rows· 10 KB
재샘플 347 turn · 7 필드 별 IRR · Disagreement 10건
⤓ 다운로드
본 리포트 백서 PDF
28rows· 2,446 KB
v1.0 · 국문 · 28 페이지 · Dean Works Research
⤓ 다운로드

Preview · 대화형 설문

앞 5명 대화 샘플

session_id 80001~80005의 10문항 전체 대화. 각 질문은 AI Base 턴 + Tail 프로빙 + 사용자 답변 + AI 마무리의 구조.

Personas

9개 페르소나 × 100명

🌙새벽 절박형

12명

영아 야제·수유 고립. 새벽 3시에 혼자 검색하다 유입.

⚡워킹맘 효율형

13명

출근 전·점심시간 빠른 답 요구. 답변 길이에 예민.

🔥기질 민감아 부모형

13명

예민·낯가림·분노조절. 원론적 훈육 조언에 불만.

👨‍👩‍👧부부 온도차형

13명

배우자 비협조 중재. 가족 플랜 수요 큼.

🆕첫째 초보형

9명

백과사전 니즈. 초보 친화적 설명 요구.

📚학습·적응 고민형

13명

5세~초3 학습·또래. 구체 단계 가이드 요구.

🎮스마트폰·미디어 고민형

12명

초1~초6 미디어 중독. 대화 스크립트 부재가 페인.

🧨사춘기 초입 갈등형

9명

초4~초6 반항·이성. 거리두기 ↔ 개입 경계.

🧪AI 회의형

6명

‘기계 공감은 가식’ 인식. 전문가 매칭 우선.

Next · Chapter 4

12 인사이트 — 증거에서 온 숫자

→