Как извлечь два значения из dict в python?
Я использую python3 и у меня есть набор данных. Он содержит следующие данные. Я пытаюсь получить желаемое значение из этого списка данных. Я испробовал много способов, но не смог понять, как это сделать.
slots_data = [
{
"id":551,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":552,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":525,
"user_id":3,
"time":"199322002",
"expire":"199322002"
},
{
"id":524,
"user_id":3,
"time":"199322002",
"expire":"199322002"
},
{
"id":553,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":550,
"user_id":2,
"time":"199322002",
"expire":"199322002"
}
]
# Desired output
# [
# {"user_id":1,"slots_ids":[551,552,553]}
# {"user_id":2,"slots_ids":[550]}
# {"user_id":3,"slots_ids":[524,525]}
# ]
Я пытался сделать это следующим образом, но очевидно, что это неправильно. Я не смог найти решение этой проблемы :
final_list = []
for item in slots_data:
obj = obj.dict()
obj = {
"user_id":item["user_id"],
"slot_ids":item["id"]
}
final_list.append(obj)
print(set(final_list))
Я бы посоветовал попробовать использовать pandas
для группировки идентификаторов пользователей вместе и преобразовать их обратно в словарь
pd.DataFrame(slots_data).groupby('user_id')['id'].agg(list).reset_index().to_dict('records')
[{'user_id': 1, 'id': [551, 552, 553]},
{'user_id': 2, 'id': [550]},
{'user_id': 3, 'id': [525, 524]}]
В другом ответе, добавленном сюда, есть хорошее решение, но вот одно без использования pandas
:
users = {}
for item in slots_data:
# Check if we've seen this user before,
if item['user_id'] not in users:
# if not, create a new entry for them
users[item['user_id']] = {'user_id': item['user_id'], 'slot_ids': []}
# Add their slot ID to their dictionary
users[item['user_id']]['slot_ids'].append(item['id'])
# We only need the values (dicts)
output_list = list(users.values())
простой способ простого цикла
>>> result = {}
>>> for i in slots_data:
... if i['user_id'] not in result:
... result[i['user_id']] = []
... result[i['user_id']].append(i['id'])
...
>>> output = []
>>> for i in result:
... dict_obj = dict(user_id=i, slots_id=result[i])
... output.append(dict_obj)
...
>>> output
[{'user_id': 1, 'slots_id': [551, 552, 553]}, {'user_id': 3, 'slots_id': [525, 524]}, {'user_id': 2, 'slots_id': [550]}]
Это может быть сделано в using listcomprehension:
final_list = [{"user_id": user_id, "id":sorted([slot["id"] for slot in slots_data if slot["user_id"] == user_id])} for user_id in sorted(set([slot["user_id"] for slot in slots_data]))]
Более подробная и лучше отформатированная версия того же кода:
all_user_ids = [slot["user_id"] for slot in slots_data]
unique_user_ids = sorted(set(all_user_ids))
final_list = [
{
"user_id": user_id,
"id": sorted([slot["id"] for slot in slots_data if slot["user_id"] == user_id])
}
for user_id in unique_user_ids]
Объяснение:
- получить все идентификаторы пользователей с помощью понимания списка
- получите уникальные идентификаторы пользователей, создав набор
- создайте окончательный список словарей, используя понимание списка.
- каждое поле
id
само по себе является списком с использованием понимания списка. Мы получаем id слота и добавляем его в список, только если id пользователей совпадают .
Для этого можно использовать следующее. Чисто Python. Без каких-либо зависимостей.
slots_data = [
{
"id":551,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":552,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":525,
"user_id":3,
"time":"199322002",
"expire":"199322002"
},
{
"id":524,
"user_id":3,
"time":"199322002",
"expire":"199322002"
},
{
"id":553,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":550,
"user_id":2,
"time":"199322002",
"expire":"199322002"
}
]
user_wise_slots = {}
for slot_detail in slots_data:
if not slot_detail["user_id"] in user_wise_slots:
user_wise_slots[slot_detail["user_id"]] = {
"user_id": slot_detail["user_id"],
"slot_ids": []
}
user_wise_slots[slot_detail["user_id"]]["slot_ids"].append(slot_detail["id"])
print(user_wise_slots.values())
Здесь много хороших ответов.
Если бы я занимался этим, я бы основывал свой ответ на setdefault
и/или collections.defaultdict
, которые могут быть использованы аналогичным образом. Я думаю, что версия defaultdict
очень читабельна, но если вы еще не импортируете коллекции, то можно обойтись и без нее.
Учитывая ваши данные:
slots_data = [
{
"id":551,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
{
"id":552,
"user_id":1,
"time":"199322002",
"expire":"199322002"
},
#....
]
Вы можете преобразовать его в желаемый результат с помощью:
reshaped = {}
for slot in slots_data:
reshaped.setdefault(slot["user_id"],{ # return the value for this key if it exists...
"user_id": slot["user_id"], # otherwise set it to a default value and return it
"slots_ids":[]
})["slots_ids"].append(slot["id"]) # given the returned value, append our new data to the sub-key
## Now the sub-key lists can be sorted in-place via
for slot in reshaped.values():
slot["slots_ids"].sort()
print(list(reshaped.values()))
Даю вам:
[
{'user_id': 1, 'slots_ids': [551, 552, 553]},
{'user_id': 3, 'slots_ids': [524, 525]},
{'user_id': 2, 'slots_ids': [550]}
]
Если вам зачем-то нужно, чтобы элементы в основном списке также были отсортированы в порядке "ключ", вы можете добавить:
reshaped = sorted(reshaped.values(),key=lambda x: x["user_id"])
print(reshaped)
Это даст вам:
[
{'user_id': 1, 'slots_ids': [551, 552, 553]},
{'user_id': 2, 'slots_ids': [550]},
{'user_id': 3, 'slots_ids': [524, 525]}
]
Используя pandas, вы можете легко достичь результата. Сначала установите pandas, если у вас его нет, следующим образом
pip install pandas
import pandas as pd
df = pd.DataFrame(slots_data) #create dataframe
df1 = df.groupby("user_id")['id'].apply(list).reset_index(name="slots_ids") #groupby on user_id and combine elements of id in list and give the column name is slots_ids
final_slots_data = df1.to_dict('records') # convert dataframe into a list of dictionary
final_slots_data
Выход:
[{'user_id': 1, 'slots_ids': [551, 552, 553]},
{'user_id': 2, 'slots_ids': [550]},
{'user_id': 3, 'slots_ids': [525, 524]}]