๋ฐ์ํ
1. ๋ฐ์ดํฐ ๋ณํํ๊ธฐ
1) ์ ๊ทํํ์์ผ๋ก ๋ฌธ์ ๋ฐ์ดํฐ ์ ๋ฆฌํ๊ธฐ
# ์ ๊ทํํ์ - ^ ; Not์ ์๋ฏธ์ ๊ฐ์. ์ฆ 0~9 a~z A~Z : , ๊ฐ ์๋ ์ด์ธ์ ๋ฌธ์๋ ๋ชจ๋ ๋์ด์ฐ๊ธฐ๋ก ๋์ฒดํ๊ฒ ๋ค๋ ์๋ฏธ.
df['Book-Title'] = [re.sub(r'[^0-9a-zA-Z:,]', ' ',str(i)) for i in df['Book-Title']]
df['Main_Title'] = [i.split(' ')[0] for i in df['Book-Title']]
# Main Title ์ด ํ์ ์ ๋ชฉ ๋จ์ด๋ค ๋ค ๊ฐ์ ธ์ค๊ธฐ
df['Sub_Title'] = [''.join(i.split(' ')[1:]) for i in df['Book-Title']]
2) np.where ํตํด ๊ฐ ๋ณ๊ฒฝํ๊ธฐ
# Sub Title์ ๊ฐ์ด ์์ ๊ฒฝ์ฐ ํด๋น ๊ฐ์ No SUB์ผ๋ก ๋ณ๊ฒฝ, ๊ฐ์ด ์๋ ๊ฒฝ์ฐ๋ ๊ทธ๋๋ก ๊ทธ ๊ฐ ์ ์ง
# np.where(๋ณ๊ฒฝ์กฐ๊ฑด, ์ผ์นํ ๊ฒฝ์ฐ, ์ผ์นํ์ง ์์ ๊ฒฝ์ฐ)
df['Sub_Title'] = np.where(df['Sub_Title'] == '', 'No_SUB', df['Sub_Title'])
๋ฐ์ํ