정규표현식(RegEx) 마스터: 지저분한 텍스트에서 이메일과 전화번호만 쏙 뽑아내는 방법

요즘 노코드(No-code) 툴을 활용해 웹사이트를 구축하거나 업무 자동화 워크플로우를 만드는 분들이 정말 많습니다. 자피어(Zapier), 메이크(Make), 버블(Bubble) 같은 툴을 쓰다 보면 “코딩 없이도 다 되네!” 싶다가도, 꼭 한 번씩 막히는 순간이 찾아옵니다. 바로 지저분하게 섞인 텍스트 데이터에서 원하는 정보만 골라내야 할 때입니다.

“노코드 툴 내부 기능으로 텍스트 자르기(Split)나 바꾸기(Replace)를 해봤지만, 데이터 형식이 제각각이라 자꾸 에러가 나요!”

이런 분들을 위해 준비했습니다. 노코드의 한계를 가볍게 뛰어넘는 데이터 정제의 치트키, 바로 정규표현식(RegEx, Regular Expression)입니다. 오늘은 복잡한 문자열 속에서 마법처럼 이메일과 전화번호만 쏙 뽑아내는 실전 패턴과 활용법을 알아보겠습니다.

노코드 툴의 한계, 왜 정규표현식일까?

대부분의 노코드 툴은 문자열을 다루는 기본적인 함수를 제공합니다. 하지만 고객이 자유롭게 입력한 문의 글이나 웹 스크래핑으로 긁어온 가공되지 않은 텍스트는 규칙이 없습니다.

  • 공백이 제각각인 경우 (예: 010 – 1234 – 5678)
  • 일반 텍스트 중간에 이메일이 숨겨져 있는 경우 (예: “문의는 hong@test.com 으로 주세요!”)

이럴 때 일반적인 텍스트 함수로만 접근하면 수십 개의 조건문(If-Else)을 짜야 하거나, 결국 실패하기 마련입니다. 반면 정규표현식은 문자열의 고유한 ‘패턴’을 찾아내기 때문에, 복잡한 가공 없이 단 한 줄의 수식만으로 완벽하게 원하는 데이터만 추출할 수 있습니다.

마법의 주문 #1: 이메일 주소만 쏙 뽑아내기

텍스트 더미 속에서 이메일 주소만 정확하게 추출하고 싶다면 아래의 패턴을 복사해서 노코드 툴에 그대로 붙여넣으세요.

코드 스니펫

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

💡 패턴 뜯어보기

  • [a-zA-Z0-9._%+-]+: 영문 대소문자, 숫자, 그리고 특수문자(., _, %, +, -)가 1글자 이상 연속됨을 의미합니다. (이메일 아이디 부분)
  • @: 이메일의 핵심 구분자인 골뱅이 기호와 정확히 일치하는 부분을 찾습니다.
  • [a-zA-Z0-9.-]+: 도메인 이름(예: naver, gmail 등)을 인식합니다.
  • \.: 점(.) 자체를 의미합니다. (정규식에서 점은 특수 기호라 앞에 백슬래시를 붙여줍니다.)
  • [a-zA-Z]{2,}: com, net, co.kr 등 최소 2글자 이상의 영문자로 끝나는 도메인 확장자를 잡아냅니다.

마법의 주문 #2: 한국 전화번호 완벽 추출하기

한국 전화번호는 하이픈(-)이 있을 때도 있고, 공백이나 점(.)이 섞여 있기도 해서 추출하기가 까다롭습니다. 이 모든 변수를 깔끔하게 잡아내는 전천후 패턴입니다.

코드 스니펫

01[016789][-.\s]?\d{3,4}[-.\s]?\d{4}

💡 패턴 뜯어보기

  • 01[016789]: 대한민국 휴대폰 번호의 시작인 010, 011, 016, 017, 018, 019를 인식합니다.
  • [-.\s]?: 하이픈(-), 점(.), 또는 공백(\s)이 있을 수도 있고(?) 없을 수도 있다는 뜻입니다. 덕분에 붙여 쓰거나 띄어 써도 모두 잡아냅니다.
  • \d{3,4}: 숫자가 3자리 또는 4자리 연속으로 나오는 중간 국번을 찾습니다.
  • \d{4}: 마지막 4자리 숫자를 의미합니다.

노코드 툴에서 실전 활용하는 방법

이 마법 같은 패턴들을 어떻게 노코드 툴에 적용할까요? 가장 대표적인 자동화 툴인 Make(구 Integromat)와 Zapier를 기준으로 설명해 드릴게요.

노코드 툴사용하는 기능 / 모듈설정 방법
Make (Integromat)Text Parser 모듈 (Match Pattern)Pattern란에 위 정규식을 넣고, Text 항목에 원본 데이터를 연결합니다.
ZapierFormatter by Zapier (Text -> Extract Pattern)Input에 원본을 넣고, Pattern에 정규식을 입력하면 결과값만 깔끔하게 추출됩니다.

이렇게 정규표현식으로 추출한 이메일과 전화번호는 구글 스프레드시트에 자동으로 저장하거나, CRM 솔루션의 고객 정보로 깔끔하게 업데이트할 수 있습니다. 매일 수작업으로 복사·붙여넣기 하던 시간이 완전히 제로(0)가 되는 경험을 하시게 될 겁니다.

마치며: 정규표현식은 노코드의 날개입니다

코드 한 줄 안 쓰고 서비스를 만드는 ‘노코드 시대’라지만, 정규표현식 같은 최소한의 텍스트 무기를 다룰 줄 알면 구현할 수 있는 자동화의 수준이 수십 배는 넓어집니다.

오늘 소개해 드린 이메일과 전화번호 추출 패턴은 업무 자동화의 가장 기본이자 핵심입니다. 지금 바로 여러분이 사용하는 노코드 툴에 적용해 보세요. 지저분했던 텍스트 데이터가 순식간에 돈이 되는 깔끔한 고객 데이터셋으로 변하는 마법을 경험할 수 있습니다!

관련 글 보기