Неизвестная проблема с Celery и Modin (Pandas), выполнение задачи застряло и нет ошибки
Описание:
Я установил проект Django с Celery и RabbitMQ в Docker. Я пытаюсь выполнить задачу Celery из моего набора представлений API, и я вижу, что задача получена в журналах контейнера Celery. Однако задача, похоже, застревает, когда я использую Pandas с Modin.
Наблюдение:
- Утверждения печати над использованием Pandas Modin работают нормально.
- Не возникает никаких ошибок или исключений.
- Печатные операторы после строки Pandas не выполняются.
Пример кода:
@shared_task
def test_pandas_df():
print("Start task")
test_df = pd.DataFrame({"A": [1, 2, 3], "B": ["a", "b", "c"]})
logger.info("Df Data :")
print(test_df)
# In my viewset:
test_pandas_df.delay()
Журнал контейнера с сельдереем:
Моя конечная цель - использовать Pandas Modin для чтения CSV-данных и выполнения некоторых агрегаций. Я создал простую тестовую функцию, чтобы понять выполнение задачи celery, но я не могу отладить причину, по которой задача застревает.
Я буду пробовать на отдельной машине и использовать Pandas вместо Modin (хотя он должен отступать).
Я пытаюсь понять, почему не отображается ошибка или прогресс. Пожалуйста, подскажите мне, если я что-то упустил.
[Update]
Я пробовал использовать pandas вместо modin и это работает. Теперь вопрос в том, что вызывает застревание Modin!!!
тот же код работал, если изменить import modin.pandas
как pd на import pandas as pd