DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='',
float_format=None, columns=None, header=True, index=True,
index_label=None, mode='w', encoding=None, compression='infer',
quoting=None, quotechar='"', line_terminator=None, chunksize=None,
date_format=None, doublequote=True, escapechar=None, decimal='.',
errors='strict', storage_options=None)
객체를 콤마로 구분된 값 (csv) 파일로 저장합니다.
파라미터
path_or_buf: 문자열, 경로 객체, 파일같은 객체, None (기본값: None)
문자열, (os.PathLike[str]을 구현한) 경로 객체, write() 함수를 구현한 파일같은 객체입니다. None일 경우 결과는 문자열로 반환됩니다. 이진 파일이 아닌 객체를 전달하려면 newline="으로 열려야 합니다. 이진 파일 객체를 전달하려면 mode는 b를 포함하고 있어야 할 것입니다.
sep: 문자열 (기본값: ',')
길이 1의 문자열. 결과 파일의 필드 구분자이다.
na_rep: 문자열 (기본값: '')
비어있는 데이터 값을 문자열로 대체한다.
float_format: 문자열 (기본값: None)
실수 숫자에 대한 문자열 서식을 지정한다.
columns: 연속된 값 (선택)
저장할 열 이름이다
header: 불, 문자열 리스트 (기본값: True)
열의 이름을 지정한다. 문자열 리스트가 주어지면 열 이름의 에일리어스로 간주된다.
index: 불 (기본값: True)
행 이름(인덱스)를 지정한다.
index_label: 문자열, 연속된 값, False (기본값: None)
필요하다면 인덱스 열에 레이블을 지정한다. None이 주어지고 header와 index가 True이면 인덱스 이름이 사용된다. 객체가 다중인덱스를 사용할 때 연속된 값이 주어져야 한다. False는 인덱스 이름의 필드를 출력하지 않는다. index_label=False를 사용하면 R에서 더 쉽게 불러올 수 있다.
mode: 문자열 (기본값: w)
파이썬 쓰기 모드이다.
encoding: 문자열 (선택, 기본값: utf-8)
출력 파일에서 사용될 인코딩 방식을 나타낸다. path_or_buf이 이진 파일 객체가 아니라면 encoding은 지원되지 않는다.
compression: 문자열 혹은 딕셔너리. (기본값: infer)
on-the-fly 방식(프로그램을 재시작할 필요가 없는) 압축에 사용됩니다. infer이나 경로가 경로 같다면, .gz, .bz2, .zip, .xz., .zst (혹은 압축 없음) 확장자의 압축 형식을 감지합니다.
압축을 하지 않으시려면 None을 입력하세요
해당 값은 또한 딕셔너리일 수도 있습니다. 이 딕셔너리의 키 값 method는 zip, gzip, bz2, zstd이어야만 합니다. 다른 키-값 쌍은 각자 zipfile.ZipFiile, gzip.GzipFile, bz2.BZ2File 혹은 zstandard.ZstdDecompressor로 전달됩니다. 예를 들어 compression={'method':'gzip', 'compresslevel': 1, 'mtime':1} 은 빠른 압축 속도와 재현 가능한 gzip 파일 저장에 사용될 수 있습니다.
quoting: (csv 모듈로부터 선택적 상수, 기본값: csv.QUOTE_MINIMAL)
실수 형식으로 지정했다면 실수는 문자열로 변경되며, 그 결과로 csv.QUOTE_NONNUMERIC이 해당 숫자를 숫자가 아닌 것으로 다룰 것입니다.
quotechar:
문자열 (기본값:' " ')길이 1의 문자, 이는 필드에 따옴표를 치기 위해 사용된다.
line_terminator: 문자열 (선택, 기본값: os.linesep)
출력 파일에서 사용될 새 줄 문자 혹은 연속된 문자이다. 기본값은 해당 메소드가 불려진 OS에 따라 다르게 출력된다. (\n은 리눅스, \r\n은 윈도우즈 등)
chunksize: 정수 혹은 None
한번에 쓸 행의 수이다.
date_format: 문자열 (기본값: None)
datetime 객체로 쓸 문자열의 서식이다.
doublequote: 불 (기본값: True)
필드 내의 quotechar의 따옴표를 제어한다.
escapechar: 문자열 (기본값: None)
길이 1의 문자열이다. 해당 문자는 올바른 위치의 sep와 quotechar을 이스케이프 할 때 사용된다.
decimal: 문자열(기본값: '.')
소숫점 자리를 구분하기 위한 문자입니다.
errors: 문자열 (기본값: strict)
인코딩, 디코딩 에러들이 어떻게 다뤄질 지 명시한다. 모든 옵션에 대해서는 open()을 참고하자.
storage_options: 딕셔너리 (선택)
추가 옵션을 주어서 특별한 객체, 예를 들어 host, port, username, password를 다룰 수 있습니다.
HTTP(S) 주소의 키-값 쌍은 헤더 옵션으로 urllib로 전송됩니다. s3://, gcs://같은 주소들의 키-값 쌍은 fsspec로 전송됩니다. 이와 관련된 더 자세한 내용은 fsspec, urllib 문서에 있습니다.
'Pandas' 카테고리의 다른 글
pandas 1.4.3 - pandas.read_clipboard (0) | 2022.08.29 |
---|---|
pandas 1.4.3 - pandas.read_fwf (0) | 2022.08.29 |
pandas 1.4.3 - pandas.read_csv (0) | 2022.08.29 |
pandas 1.4.3 - pandas.read_table (0) | 2022.08.29 |
pandas 1.4.3 - pandas.DataFrame.to_pickle (0) | 2022.08.29 |