엑셀에서 복사한 이메일 목록이 전부 대문자로 되어 있다. [email protected]처럼. 하나하나 수정하기엔 500줄이 넘는다. 혹은 코드에 쓸 변수명을 camelCase로 바꿔야 하는데 전부 소문자로 붙여 써놨다. 이런 단순 반복 작업에 시간을 쏟는 건 아깝다.
대소문자 변환, 이런 경우에 필요하다
영문 텍스트를 다루다 보면 대소문자를 바꿔야 하는 상황이 생각보다 자주 생긴다.
- 이메일 주소를 소문자로 통일 (RFC 표준상 대소문자 무관이지만 보기 불편함)
- 제목을 Title Case로 변환 ("the quick brown fox" → "The Quick Brown Fox")
- SQL 키워드를 대문자로 정리 (select → SELECT)
- 프로그래밍 변수명을 camelCase나 snake_case로 변환
텍스트 변환기에 텍스트를 붙여넣고 원하는 변환 버튼을 누르면 된다. 대문자, 소문자, Title Case, Sentence case, 토글, 교대 대소문자까지 7가지 옵션이 있어서 상황에 맞게 골라 쓸 수 있다.
공백과 줄바꿈 정리
웹페이지에서 복사한 텍스트에는 보이지 않는 공백이 섞여 있는 경우가 많다. 탭 문자, 전각 공백, 연속된 빈 줄 같은 것들이다. 눈에는 안 보이지만 데이터 처리에서는 오류를 일으킨다.
| 기능 | 하는 일 | 활용 상황 |
|---|---|---|
| 공백 제거 | 모든 공백 문자 삭제 | 전화번호 형식 통일 (010 1234 5678 → 01012345678) |
| 중복 공백 병합 | 연속 공백을 하나로 | 복사 붙여넣기 후 정리 |
| 줄바꿈 제거 | 여러 줄을 한 줄로 | 채팅 로그를 한 줄 텍스트로 합치기 |
| 빈 줄 제거 | 내용 없는 빈 줄만 삭제 | 코드 정리, 문서 포맷팅 |
| 앞뒤 공백 정리 | 각 줄의 시작/끝 공백 제거 | CSV 데이터 클리닝 |
중복 제거와 정렬
목록 데이터를 다룰 때 가장 많이 쓰는 기능 두 가지다.
중복 줄 제거
이메일 수집 결과에서 같은 주소가 여러 번 들어가 있을 때, 중복 제거 버튼 한 번이면 고유한 항목만 남는다. 엑셀에서 중복 제거 기능을 찾는 것보다 빠르다.
줄 정렬
알파벳순이나 가나다순으로 줄 단위 정렬이 된다. 회원 명단이나 상품 목록을 정리할 때 유용하다. 역순 정렬과 무작위 배열도 지원한다.
TIP 줄 번호 추가 기능도 있다. 정렬 없이 번호만 붙여야 하는 경우, 예를 들어 면접 질문 목록에 순번을 매기거나 참고 문헌에 번호를 달 때 쓰면 편하다.
인코딩 변환은 개발자에게 특히 유용
URL에 한글이 포함되면 %ED%95%9C%EA%B8%80 같은 형태로 인코딩된다. 이걸 사람이 읽을 수 있는 형태로 바꾸거나, 반대로 특수문자를 인코딩해야 할 때가 있다. Base64, HTML 엔티티, 유니코드 변환까지 같은 화면에서 처리할 수 있어서, 별도의 개발 도구를 열지 않아도 된다.
이런 텍스트 정리 작업은 한 번에 끝내면 5초, 수작업으로 하면 30분이다. 도구의 존재를 아느냐 모르느냐의 차이다.