03
Chapter 03 · Sample

보니 — 같은 100명의 두 얼굴

Dean Works가 운영하는 육아 코칭 AI 서비스 보니(bonny)의 고객을 모사한 샘플 100명을 구성하고, 이들이 남긴 두 가지 형식의 응답을 수집했다. 왼쪽 목록에서 섹션을 선택하면 데이터 구조·다운로드·대화형/객관식 프리뷰·페르소나 구성을 순차로 확인할 수 있다.

100
세션
~45
평균 turn
세션당
9
페르소나
Overview

두 데이터셋 한눈에

같은 응답자 100명이 두 가지 형식에 답했다. 대화형 설문 10질문(Base + Tail 프로빙) + 객관식 15문항(SC · MC · 5-Likert · NPS · 짧은 주관식). session_id로 두 데이터셋이 JOIN되므로 같은 사람이 남긴 정형/비정형 응답을 직접 대비할 수 있다.

100
세션
80001~80100
~4,500
대화 turn
평균 45 turn / 세션
15
객관식 문항
SC · MC · Likert · NPS
9
페르소나
× 8 자녀 연령 구간
Data Structure

두 데이터셋의 구조

Dataset A · 대화형 설문
~4,500
예상 대화 turn 수
  • — 100 세션 × 10 질문
  • — 질문당 AI 3~5턴 + 사용자 답변
  • — AI는 직전 응답 키워드를 받아서 파고드는 Tail 질문
  • — CSV 포맷(AI 질문 · 사용자 답변 행 단위)
Dataset B · 객관식 설문
100
응답 행 수 (세션당 1행)
  • — 15문항 (SC · MC · 5-Likert · NPS · 짧은 주관식)
  • — 인구통계·사용빈도·만족도·전환·NPS·한 단어
  • — session_id로 Dataset A와 JOIN
  • — CSV 포맷(응답자당 1행)

같은 응답자 100명이 두 번 답했다는 것이 이 샘플의 힘이다. 객관식은 Q6 리커트에서 ② 불만족을 택한 사람이, 대화형 설문에서는 “답은 빨리 왔는데 너무 뻔한 소리만 하니까 답답해서 새벽에 혼자 울었어요”라고 말한다. 두 데이터를 같은 화면에 놓으면 객관식의 한 칸이 압축하고 있는 맥락의 부피가 보인다.

샘플은 전적으로 가공 데이터다. 실명·실전화번호는 쓰이지 않았고, 페르소나 카드를 근거로 LLM 생성기가 대화를 직조했다. 생성 스크립트는 공개 가능하며 같은 입력으로 재현할 수 있다.

라벨링 해상도 프리뷰

같은 세션 — 첫 답변만 vs 꼬리 전체, 무엇이 달라지나

P-80001의 Q1(“처음 보니를 만나시게 된 순간”) 한 세트. 같은 응답자·같은 라벨러·같은 폐쇄 어휘 — 입력으로 줄 turn 집합만 바꿨을 때 어떤 축이 사라지고 어떤 라벨이 새로 드러나는지 직접 본다.

First-Turn only · 1 turn
4
활성 축
6
총 라벨 수
첫 답변 1건만 라벨러에 투입
Full-Tail · 4 turns
6
활성 축
15
총 라벨 수
꼬리 Tail-1·2·3까지 모두 포함
T-80001-01-01· First Turn (첫 답변)
AI처음 보니를 만나시게 된 순간을 떠올려주세요.

새벽 3시쯤이었어요. 애가 백일 전인데 계속 울고 안 자서 저도 한숨도 못 자고 멘붕 와서 핸드폰으로 검색하다가 들어왔어요

em:무력감em:피로bhv:새벽_검색bhv:즉답_요청drv:24시간_즉답cc:수면_야제
T-80001-01-03· Tail Turn (꼬리 답변)
AI그때 남편분은 함께 계셨을까요?

남편은 아침에 출근해야되니까 자고있고.. 깨우기도 미안하고 해서 그냥 혼자 애 안고 거실 왔다갔다 했어요. 근데 애는 계속 울고 저도 울고 있었어요 솔직히

em:고립감em:무력감cc:부부_육아분담
T-80001-01-05· Tail Turn (꼬리 답변)
AI그 순간 검색 말고 다른 선택지는 없으셨어요?

카페는 글 올려도 답변이 몇시간 뒤에나 달리잖아요. 당장 어떻게 해야할지 알아야하는데... 누구라도 당장 답 주는게 필요했어요

bhv:즉답_요청drv:24시간_즉답alt:맘카페
T-80001-01-07· Tail Turn (꼬리 답변)
AI보니가 준 첫 답변이 기억나세요? 어떤 느낌이었는지.

솔직히 답은 바로 왔는데.. 너무 원론적이어서 오히려 더 허무했어요. '배고프거나 졸리거나 불편한 거예요' 이런거요. 그건 저도 알거든요 근데 뭘 해야하는지를 모르니까 물어본건데

em:실망pn:원론적_답변pn:판단_정보_부족
이 세션에서 첫 답변이 놓친 것
  • pain 축 자체가 사라진다— 원론적_답변·판단_정보_부족은 Tail-3(T-07)에서만 등장. 첫 답변만 보면 이 세션은 ‘pain 없음’.
  • 고립감·부부 육아분담— Tail-1(T-03)에서 드러나는 사회적 맥락. 첫 답변에는 단순 ‘무력감·피로’만 기록된다.
  • 맘카페 대안 채널— Tail-2(T-05)의 alt_channel. 첫 답변에는 ‘핸드폰 검색’이라는 행동만 있을 뿐, 구체 채널명은 없다.

전체 100세션 × 4축 × 11개 인사이트의 누락 비교는 꼬리효과 →에서 확인.

Downloads

전체 파일 다운로드

  • 대화형 설문 원본 CSV
    0rows· 0 KB

    100세션 · 평균 45턴 · welcome/verify/chat/closing 포함

    ⤓ 다운로드
  • 객관식 설문 CSV
    0rows· 0 KB

    15문항 · 세션당 1행 · session_id로 대화형 설문과 JOIN

    ⤓ 다운로드
  • 세션 메타데이터 JSON
    100rows· 42 KB

    페르소나·부모 나이대·가구·자녀 연령 (대화형 CSV와 동일 session_id)

    ⤓ 다운로드
  • ELL 라벨된 user turn
    3,478rows· 2,536 KB

    2-Pass 자기검증 완료 · 9축 라벨 · JSONL 스트림

    ⤓ 다운로드
  • 12 핵심 인사이트 JSON
    12rows· 64 KB

    claim · derivation · so_what narrative + evidence turn_ids 포함

    ⤓ 다운로드
  • 토픽 induction 결과
    14rows· 256 KB

    3-pass · size ≥ 15 필터링 · 3,478 turn 할당 정보

    ⤓ 다운로드
  • 10% Jaccard QC 보고서
    347rows· 10 KB

    재샘플 347 turn · 7 필드 별 IRR · Disagreement 10건

    ⤓ 다운로드
  • 본 리포트 백서 PDF
    28rows· 2,446 KB

    v1.0 · 국문 · 28 페이지 · Dean Works Research

    ⤓ 다운로드
Preview · 대화형 설문

앞 5명 대화 샘플

session_id 80001~80005의 10문항 전체 대화. 각 질문은 AI Base 턴 + Tail 프로빙 + 사용자 답변 + AI 마무리의 구조.

    Personas

    9개 페르소나 × 100명

    🌙새벽 절박형
    12

    영아 야제·수유 고립. 새벽 3시에 혼자 검색하다 유입.

    워킹맘 효율형
    13

    출근 전·점심시간 빠른 답 요구. 답변 길이에 예민.

    🔥기질 민감아 부모형
    13

    예민·낯가림·분노조절. 원론적 훈육 조언에 불만.

    👨‍👩‍👧부부 온도차형
    13

    배우자 비협조 중재. 가족 플랜 수요 큼.

    🆕첫째 초보형
    9

    백과사전 니즈. 초보 친화적 설명 요구.

    📚학습·적응 고민형
    13

    5세~초3 학습·또래. 구체 단계 가이드 요구.

    🎮스마트폰·미디어 고민형
    12

    초1~초6 미디어 중독. 대화 스크립트 부재가 페인.

    🧨사춘기 초입 갈등형
    9

    초4~초6 반항·이성. 거리두기 ↔ 개입 경계.

    🧪AI 회의형
    6

    ‘기계 공감은 가식’ 인식. 전문가 매칭 우선.

    Next · Chapter 4
    12 인사이트 — 증거에서 온 숫자