반응형
To do : 데이터프레임 내 '자산' 컬럼의 내용 중 알파벳으로 이뤄진 키워드만 추출해서 남기고자 함
How to : Pandas 의 함수인 extract 사용 (pandas.Series.str.extract)
DataFrame['col1'] = DataFrame['col1'].str.extract(r'(reg_express)')
레스고
1. 데이터프레임 준비
In [59]:
bithumb
Out[59]:
2. 예제 적용
In [60]:
bithumb['자산'] = bithumb['자산'].str.extract(r'([A-Z]+)')
bithumb
데이터프레임 내 '자산' 컬럼에 대해서 알파벳 키워드만 잘 추출이 되었다.
마찬가지로 원하고자 하는 정규표현식을 사용하여 원하는 키워드를 추출해서 사용할 수 있도록 하자!
* 주의 할 점 :정규표현식 자체가 하나의 그룹화가 되어야 하기 때문에 소괄호로 정규표현식을 묶어야 함
그렇지 않다면 다음과 같은 에러가 발생 할 것.
ValueError: pattern contains no capture groups
Process finished with exit code 1
끄읏
참고 : https://pandas.pydata.org/docs/reference/api/pandas.Series.str.extract.html
반응형
'Development > Python' 카테고리의 다른 글
[Python] 판다스 데이터프레임 전체 프린트(Pandas DataFrame Print) (0) | 2021.10.22 |
---|---|
[Python] Pytorch 설치 && 설치 후 GPU Test (1) | 2021.10.13 |
[Python] 사용자 정의 함수 사용 시 주의 할 점 (0) | 2021.10.06 |
Pandas Merge시 행 증가하는 문제 원인 및 해결 (0) | 2021.10.01 |
[Python] Numa Node 0 에러 메세지 해결 (0) | 2021.09.30 |
댓글