Как извлечь два значения из dict в python?

Я использую python3 и у меня есть набор данных. Он содержит следующие данные. Я пытаюсь получить желаемое значение из этого списка данных. Я испробовал много способов, но не смог понять, как это сделать.

slots_data = [
        {
            "id":551,
            "user_id":1,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":552,
            "user_id":1,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":525,
            "user_id":3,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":524,
            "user_id":3,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":553,
            "user_id":1,
            "time":"199322002",
            "expire":"199322002"
        },
         {
            "id":550,
            "user_id":2,
            "time":"199322002",
            "expire":"199322002"
        }
    ]
    
    
    # Desired output 
    # [
    # {"user_id":1,"slots_ids":[551,552,553]}
    # {"user_id":2,"slots_ids":[550]}
    # {"user_id":3,"slots_ids":[524,525]}
    # ]

Я пытался сделать это следующим образом, но очевидно, что это неправильно. Я не смог найти решение этой проблемы :

final_list = []
for item in slots_data:
    obj = obj.dict()
    obj = {
    "user_id":item["user_id"],
    "slot_ids":item["id"]
    }

    final_list.append(obj)

print(set(final_list))

Я бы посоветовал попробовать использовать pandas для группировки идентификаторов пользователей вместе и преобразовать их обратно в словарь

pd.DataFrame(slots_data).groupby('user_id')['id'].agg(list).reset_index().to_dict('records')

[{'user_id': 1, 'id': [551, 552, 553]},
 {'user_id': 2, 'id': [550]},
 {'user_id': 3, 'id': [525, 524]}]

В другом ответе, добавленном сюда, есть хорошее решение, но вот одно без использования pandas:

users = {}
for item in slots_data:
    # Check if we've seen this user before,
    if item['user_id'] not in users:
        # if not, create a new entry for them
        users[item['user_id']] = {'user_id': item['user_id'], 'slot_ids': []}

    # Add their slot ID to their dictionary
    users[item['user_id']]['slot_ids'].append(item['id'])

# We only need the values (dicts)
output_list = list(users.values())

простой способ простого цикла

>>> result = {}
>>> for i in slots_data:
...     if i['user_id'] not in result:
...             result[i['user_id']] = []
...     result[i['user_id']].append(i['id'])
... 
>>> output = []
>>> for i in result:
...     dict_obj = dict(user_id=i, slots_id=result[i])
...     output.append(dict_obj)
... 
>>> output
[{'user_id': 1, 'slots_id': [551, 552, 553]}, {'user_id': 3, 'slots_id': [525, 524]}, {'user_id': 2, 'slots_id': [550]}]

Это может быть сделано в using listcomprehension:

final_list = [{"user_id": user_id, "id":sorted([slot["id"] for slot in slots_data if slot["user_id"] == user_id])} for user_id in sorted(set([slot["user_id"] for slot in slots_data]))]

Более подробная и лучше отформатированная версия того же кода:

all_user_ids = [slot["user_id"] for slot in slots_data]
unique_user_ids = sorted(set(all_user_ids))
final_list = [
    {
        "user_id": user_id,
        "id": sorted([slot["id"] for slot in slots_data if slot["user_id"] == user_id])
    }
    for user_id in unique_user_ids]

Объяснение:

  1. получить все идентификаторы пользователей с помощью понимания списка
  2. получите уникальные идентификаторы пользователей, создав набор
  3. создайте окончательный список словарей, используя понимание списка.
  4. каждое поле id само по себе является списком с использованием понимания списка. Мы получаем id слота и добавляем его в список, только если id пользователей совпадают
  5. .

Для этого можно использовать следующее. Чисто Python. Без каких-либо зависимостей.

slots_data = [
        {
            "id":551,
            "user_id":1,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":552,
            "user_id":1,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":525,
            "user_id":3,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":524,
            "user_id":3,
            "time":"199322002",
            "expire":"199322002"
        },
        {
            "id":553,
            "user_id":1,
            "time":"199322002",
            "expire":"199322002"
        },
         {
            "id":550,
            "user_id":2,
            "time":"199322002",
            "expire":"199322002"
        }
    ]

user_wise_slots = {}
for slot_detail in slots_data:
    if not slot_detail["user_id"] in user_wise_slots:
        user_wise_slots[slot_detail["user_id"]] = {
            "user_id": slot_detail["user_id"],
            "slot_ids": []
        }
    user_wise_slots[slot_detail["user_id"]]["slot_ids"].append(slot_detail["id"])
print(user_wise_slots.values())

Здесь много хороших ответов.

Если бы я занимался этим, я бы основывал свой ответ на setdefault и/или collections.defaultdict, которые могут быть использованы аналогичным образом. Я думаю, что версия defaultdict очень читабельна, но если вы еще не импортируете коллекции, то можно обойтись и без нее.

Учитывая ваши данные:

slots_data = [
    {
        "id":551,
        "user_id":1,
        "time":"199322002",
        "expire":"199322002"
    },
    {
        "id":552,
        "user_id":1,
        "time":"199322002",
        "expire":"199322002"
    },
    #....
]

Вы можете преобразовать его в желаемый результат с помощью:

reshaped = {}
for slot in slots_data:
    reshaped.setdefault(slot["user_id"],{  # return the value for this key if it exists...
        "user_id": slot["user_id"],        # otherwise set it to a default value and return it
        "slots_ids":[]
    })["slots_ids"].append(slot["id"])     # given the returned value, append our new data to the sub-key

## Now the sub-key lists can be sorted in-place via
for slot in reshaped.values():
    slot["slots_ids"].sort()

print(list(reshaped.values()))

Даю вам:

[
    {'user_id': 1, 'slots_ids': [551, 552, 553]},
    {'user_id': 3, 'slots_ids': [524, 525]},
    {'user_id': 2, 'slots_ids': [550]}
]

Если вам зачем-то нужно, чтобы элементы в основном списке также были отсортированы в порядке "ключ", вы можете добавить:

reshaped = sorted(reshaped.values(),key=lambda x: x["user_id"])
print(reshaped)

Это даст вам:

[
   {'user_id': 1, 'slots_ids': [551, 552, 553]},
   {'user_id': 2, 'slots_ids': [550]},
   {'user_id': 3, 'slots_ids': [524, 525]}
]

Используя pandas, вы можете легко достичь результата. Сначала установите pandas, если у вас его нет, следующим образом

pip install pandas

import pandas as pd
df = pd.DataFrame(slots_data) #create dataframe
df1 = df.groupby("user_id")['id'].apply(list).reset_index(name="slots_ids") #groupby on user_id and combine elements of id in list and give the column name is slots_ids
final_slots_data = df1.to_dict('records') # convert dataframe into a list of dictionary
final_slots_data

Выход:

[{'user_id': 1, 'slots_ids': [551, 552, 553]},
 {'user_id': 2, 'slots_ids': [550]},
 {'user_id': 3, 'slots_ids': [525, 524]}]
Вернуться на верх