직접 만들고, 내 생각을 더하다
세상의 트렌드를 읽고 싶어하는 한 사람으로, 목공 DIY를 좋아하고, AI, n8n을 사용해 자동화 프로세스를 배우고 있다.

PLAUD 대안? 구독료 0원 로컬 AI 회의록, 맥미니로 직접 만들었다

PLAUD 대안, 구독료 0원으로 가능할까? 맥미니에 whisper·로컬 LLM·pyannote를 얹어 만든 로컬 AI 회의록 시스템 실전 후기. 화자 분리, 프롬프트 다중 선택, 텔레그램·구글드라이브 입력까지 데이터 유출 없이 직접 구축한 전 과정.

요즘 유튜브 광고에 PLAUD 진짜 자주 뜨지 않아? 🎙️ 목에 거는 작은 AI 녹음기 하나로, 회의가 알아서 회의록이 된다는 그거. 써본 사람들도 편하다고 하더라. 근데 나는 한 가지가 계속 걸렸어.
매년 구독료를 내야 한다는 것. 중요한 업무일수록 계속 돈이 나간다는 뜻이잖아. 그래서 생각했지. "어차피 우리 집 맥미니 24시간 켜져 있는데, 이걸 내가 직접 만들면 안 되나?" 그리고 진짜 만들었어. 오늘은 그 이야기야. 😎

❓ PLAUD 같은 AI 회의록, 구독료 없이 로컬로 만들 수 있을까?

있다. 맥미니 한 대에 whisper(전사) + 로컬 LLM Qwen(문서화) + pyannote(화자 분리)를 얹으면 된다. 녹음 파일만 올리면 회의록·메일·요약·마인드맵을 자동으로 생성하고, 데이터는 기기 밖으로 안 나가고 로컬에 보관한다. 구독료 0원, 전사 분량 제한도 없다.

PLAUD, 편한 건 아는데 매년 돈 내는 게 맞아? 💸

먼저 정리하자. PLAUD는 목에 걸거나 핸드폰에 붙혀서 사용하는 AI 녹음기 + 클라우드 앱이야. 녹음하면 앱이 알아서 전사하고, 요약·마인드맵·액션아이템까지 뽑아줘. 편한 건 확실해.

근데 비용 구조를 보면 얘기가 좀 달라져. PLAUD 공식 스토어 기준으로 정리하면 이래.

구분 가격 전사 한도
기기(Plaud Note)약 159달러(일회성)-
무료 Starter0원월 300분
Pro연 99.99달러월 1,200분
Unlimited연 239.99달러하루 최대 24시간

※ 안 쓴 분(minute)은 다음 달로 이월 안 되고 매달 리셋. 전사·요약은 GPT 계열 클라우드 AI로 처리됨.

정리하면 걸리는 지점은 딱 3가지야.

  • 매년 나가는 구독료 — 기기값은 한 번이지만 구독은 계속.
  • 분(minute) 제한 — 회의 많으면 금방 바닥.
  • 녹음이 클라우드로 올라감 — 업무 회의라면 이게 제일 신경 쓰였어.

편한 건 맞아. 근데 회의 내용이 남의 서버를 거친다는 게, 나한테는 좀 걸리더라. 🤔

그래서 기존 갖고 있던 맥미니로 직접 만들었다 🛠️

사실 우리 집 맥미니 M4 Pro는 24시간 켜져 있어. 근데 하는 일이라곤 Claude Code로 코딩하는 거랑, 로컬 LLM Qwen 띄워둔 것뿐이었지. 좀 아까웠어. 이 좋은 서버를 놀리고 있었으니까.

그래서 만든 게 "로컬 음성→문서 스튜디오"야. 한 줄로 말하면 이래.

로컬 음성→문서 스튜디오 = 녹음 파일을 올리면, 로컬에서 전사 → 문서화 → 옵시디언 저장까지 한 번에 끝내는 웹앱.

전체 흐름은 이렇게 돌아가.

  1. 폰이나 소니 녹음기로 녹음 🎙️
  2. 웹페이지에 음성 파일 업로드
  3. 로컬 whisper가 텍스트로 전사
  4. 원하는 프롬프트(회의록·메일·요약) 선택
  5. 로컬 LLM이 문서 작성
  6. 옵시디언 특정 폴더에 자동 저장 📁

이 MVP는 계획서를 Claude Code한테 넘기고 단계별로 시켰더니 금방 나오더라. 😄

PLAUD랑 뭐가 다른데? (한눈 비교) ⚖️

항목 PLAUD 로컬 스튜디오
구독료매년 99~239달러0원
전사 제한월 300~1,200분무제한
데이터클라우드 전송기기 안에만
프롬프트정해진 템플릿직접 편집·추가
하드웨어전용 기기 구매있는 맥·PC 활용
손품거의 없음초기 셋업 필요

정직하게 말할게. 손품은 로컬이 더 든다. 대신 한 번 만들어두면 그다음부턴 계속 공짜야. 😌

내가 쓰는 녹음 장비랑, 실제로 쓰려니 부족했던 것 🎧

먼저 장비 얘기. 나는 PLAUD 같은 전용 기기 안 샀어. 있는 걸 써.

  • 회의용 — 10년 전에 산 소니 스테레오 녹음기. 오래됐어도 음질 좋아서 아직도 잘 써. 🎙️
  • 통화·이동용 — 알리에서 산 Smoovie(맥세이프 부착형). 2023년 11월에 38,909원에 샀어.

Smoovie는 회원가입도 필요 없어. 통화 전에 기기 녹음 버튼 누르고, 끝나면 연결 버튼만 누르면 폰으로 파일이 바로 넘어와. 최근에 전사 기능도 생겼다는데, 나는 녹음·전송만 써도 충분했어. 사놓고 방치했다가, PLAUD 광고가 자꾸 보이길래 로컬 시스템 만들면서 다시 꺼냈지. 😅 (지금은 같은 모델은 알리에서 안 보이고, 비슷한 게 5~10만원 사이에 팔더라.)

웃긴 건, PLAUD Note가 159달러(약 22만원)인데, 나는 방치돼 있던 38,909원짜리로 시작했다는 거야. 😏

① 입력 경로 — 텔레그램만으론 부족했다

Smoovie 파일은 모노 WAV라 조금만 길어져도 20MB를 훌쩍 넘어. 근데 텔레그램 봇으로 파일을 받는데, 텔레그램 봇 API는 파일을 20MB까지만 다운로드할 수 있어(공식 문서 기준). 실제로 n8n 커뮤니티에도 "file is too big" 에러 글이 많더라. 그래서 긴 녹음은 텔레그램으론 못 옮겨.

그래서 구글 드라이브 특정 폴더에 올리면 자동으로 빨려 들어오게 했어. 짧은 메모는 텔레그램, 긴 회의는 구글 드라이브. 이렇게 나누니 딱 좋더라. 📁

② 프롬프트를 여러 개 동시에

회의록만 필요한 게 아니거든. 핵심 요약도, 메일도 한 번에 필요할 때가 많아. 그래서 프롬프트를 다중 선택해서 한 방에 돌리게 했고, 프롬프트 내용도 화면에서 보고 직접 고칠 수 있게 만들었어. 내가 원하는 프롬프트를 새로 만들 수 있고, 파일에 대해 회의록을 만들어서 메일로 보낼 수 있게 다중 선택 기능을 넣었어.

화자 분리, 로컬에서 진짜 돼? (제일 까다로웠음) 🗣️

회의록의 핵심은 결국 "누가 무슨 말을 했냐"야. 그래서 마지막으로 화자 분리를 붙였어.

이건 pyannote를 따로 설치해서 진행했지. 결정한 건 이래.

  • 모델은 speaker-diarization-community-1 — 화자 수·배정이 개선된 버전.
  • CPU 고정 — 맥 MPS(GPU)는 이 연산에서 불안정해서 CPU로 돌리되, 별도 서비스로 떼서 상주.
  • 비동기 처리 — CPU라 좀 걸리니까, 진행률 보여주면서 백그라운드로.

제일 큰 함정은 HuggingFace 토큰 + 모델 약관 동의였어. 순서를 안 지키면 403이 떠서 처음에 좀 헤맸지. 😅

🧪 직접 써본 후기

맥이지만 전사는 GPU(Metal)를 써서, 느리다는 느낌이 전혀 없었어. 화자 분리는 pyannote로 따로 도니까 부담도 없었고. 30분짜리 녹음 파일까지 넣어봤는데, 오타가 아주 가끔 나오긴 해도 전체 문장은 제대로 뽑아줬어. 회의록·요약 용도로는 충분해. 👍

24시간 서버, 안 죽었나 어떻게 확인해? 🟢

로컬 서버의 단점은 명확해. 뭐 하나 조용히 죽어도 모른다는 것. 그래서 스튜디오가 whisper·래퍼·LLM·옵시디언·화자분리 상태를 3초마다 확인해 색으로 표시하게 했어. 거기에 전체 인프라(맥미니 n8n, 집 PC, 배포한 사이트들)까지 한 화면에서 보는 모니터를 따로 만들었지(다운된 서비스는 텔레그램으로 알려줘). 아침에 초록불만 확인하면 끝. 마음이 편해지더라. 😌

자주 묻는 질문 (FAQ) 🙋

Q. 전용 녹음기 꼭 필요해?

아니. 나는 10년 된 소니 녹음기랑 4만원짜리 알리 녹음기(Smoovie) 써. 있는 걸로 충분해. 폰 기본 녹음기여도 돼.

Q. 코딩 몰라도 만들 수 있어?

계획서를 Claude Code한테 넘기고 단계별로 시키면 상당 부분 자동으로 돼. 바이브 코딩 수준이면 충분히 도전할 만해(물론 지속 운영하려면 계획서 작성 Plan, 코드 검증 TDD, 문서 동기화 SYNC 등을 반영해야 코드가 꼬이지 않고 유지보수에 수월해).

Q. 맥미니 없어도 돼?

돼. 로컬 LLM 돌릴 PC면 윈도우도 OK. GPU 있으면 더 좋고. 핵심은 whisper + 로컬 LLM 조합이야.

Q. whisper 한국어 정확도는?

30분 녹음 기준, 가끔 오타는 있어도 문장은 제대로 나와. 회의록·요약이 목적이면 문제없어. 더 큰 파일이 없어서 확인은 못했지만, 2~3시간도 무리는 없을꺼라고 봐.  

Q. 완전 오프라인이야?

로컬 LLM만 쓰면 데이터가 밖으로 안 나가. 품질이 필요할 땐 상용 API로 전환하는 옵션도 넣어뒀는데, 그땐 "외부 전송" 경고가 뜨게 했어. 민감한 회의는 로컬이 기본값이야.

그래서, 만들 만해? 🚀

솔직히 말할게. 당장 편한 걸 원하면 PLAUD 사는 게 맞아. 하드웨어 완성도랑 즉시성은 직접 만든 걸로 못 이겨. 인정.

근데 (1) 이미 로컬 서버가 있고, (2) 데이터가 밖으로 나가는 게 싫고, (3) 매년 구독료가 아깝다면 → 직접 만드는 게 답이야. 나는 놀던 맥미니랑 방치된 4만원짜리 녹음기가, 매일 쓰는 회의록 공장이 됐어. 만족도 아주 높아. 😎

👉 너도 24시간 켜둔 서버가 있다면, 놀리지 말고 이것부터 만들어봐. 계획서는 Claude한테 맡기면 되니까. 시작이 반이야. 💪


댓글 쓰기