基于项的公共切片文本对列表项进行分组,通常是指在一组数据中,根据每个元素的某个共同特征(如字符串的子串)来将这些元素分成不同的组。这种操作在数据处理和分析中非常常见,尤其是在需要对大量数据进行分类和整理时。
假设我们有一个包含用户信息的列表,每个用户信息是一个字符串,格式为“姓名-年龄-城市”。我们希望根据城市对这些用户信息进行分组。
from collections import defaultdict
# 示例数据
user_list = [
"Alice-25-Shanghai",
"Bob-30-Shanghai",
"Charlie-28-Beijing",
"David-35-Beijing",
"Eve-22-Guangzhou"
]
# 根据城市分组
grouped_users = defaultdict(list)
for user in user_list:
name, age, city = user.split('-')
grouped_users[city].append(user)
# 输出分组结果
for city, users in grouped_users.items():
print(f"{city}: {users}")
grouped_users = defaultdict(list)
for user in user_list:
name, age, city = user.split('-')
grouped_users[city].append(user)
def parse_user(user):
try:
name, age, city = user.split('-')
return name, int(age), city
except ValueError:
print(f"Invalid user data: {user}")
return None, None, None
grouped_users = defaultdict(list)
for user in user_list:
name, age, city = parse_user(user)
if name and city:
grouped_users[city].append(user)
通过以上方法,可以有效地对列表项进行分组,并解决常见的分组问题。
领取专属 10元无门槛券
手把手带您无忧上云