pandas.str.split详解
pandas.str.split() 是一个用于将字符串按照指定的分隔符进行分割的函数,它可以应用于 pandas DataFrame 或 Series 中的字符串数据,下面将详细介绍 pandas.str.split() 的使用方法和参数。
1. 基本用法
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i']) 使用逗号作为分隔符进行分割 result = data.str.split(',') print(result)
输出结果:
0 [a, b, c] 1 [d, e, f] 2 [g, h, i] dtype: object
2. 设置 maxsplit 参数
maxsplit
参数用于指定最大分割次数,默认值为 1,表示不限制分割次数。
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i']) 使用逗号作为分隔符进行分割,最多分割一次 result = data.str.split(',', n=1) print(result)
输出结果:
0 [a, b, c] 1 [d, e, f] 2 [g, h, i] dtype: object
3. 设置 expand 参数
expand
参数用于控制是否将分割后的结果展开为一个新的 DataFrame,默认值为 False,表示不展开。
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i']) 使用逗号作为分隔符进行分割,并将结果展开为一个新的 DataFrame result = data.str.split(',', expand=True) print(result)
输出结果:
0 1 2 0 a b c 1 d e f 2 g h i
4. 设置 regex 参数
regex
参数用于控制是否使用正则表达式进行分割,默认值为 False,表示不使用正则表达式。
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd;e,f', 'g|h|i']) 使用逗号和分号作为分隔符进行分割,并使用正则表达式进行分割 result = data.str.split('[,;|]', regex=True) print(result)
输出结果:
0 1 2 0 a b c 1 d e f 2 g h i
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/475869.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复