-
문제 11. 탭을 공백으로 변환NLP/NLP100 2021. 1. 4. 18:25
모든 탭을 공백 문자로 변환하시오. 확인을 위해 sed명령어, tr명령어, expand명령어를 사용하시오.
datapath = "/Users/p1zz4/Downloads/popular-names.txt" with open(datapath) as p: f = [line.replace("\t", " ").rstrip() for line in p] print(f[:10]) # 전체 출력하느라 오래걸리므로 일부만 출력해서 확인
[확인]
- sed
(base) P1ZZ4:Downloads p1zz4$ sed "s/\t/ /g" re_popular-names.txt
- tr
(base) P1ZZ4:Downloads p1zz4$ tr '\tr' ' ' < re_popular-names.txt
- expand
(base) P1ZZ4:Downloads p1zz4$ expand -t 1 re_popular-names.txt
[Pandas]
pandas를 사용해서 간단하게 변환 가능하다.
import pandas as pd df = pd.read_csv('/Users/p1zz4/Downloads/popular-names.txt', sep='\t', header=None) df.to_csv('/Users/p1zz4/Downloads/re_popular-names.txt', sep=' ', index=False, header=None)
[출력 결과]
좌측이 원본 파일이고, 우측이 pandas를 사용해서 탭을 공백 문자로 변환한 파일이다.
'NLP > NLP100' 카테고리의 다른 글
문제 13. col1.txt와 col2.txt를 병합 (0) 2021.01.04 문제 12. 첫번째 열을 col.txt에, 두번째 열을 col2.txt에 저장 (0) 2021.01.04 문제 10. 몇 줄짜리 파일 (0) 2021.01.04 문제 09. Typoglycemia (0) 2021.01.04 문제 08. 암호문 (0) 2021.01.04