Как повысить скорость добавления документов в chromaDB?

Я пытаюсь добавить фрагменты текста в ChromaDB. При добавлении фрагментов процесс занимает больше времени из-за векторизации. Есть ли способ ускорить этот процесс? Я хотел бы использовать Celery для обработки каждого чанка в параллельном режиме или использовать мультипроцессинг.

Вот мой пример фрагмента кода:

ids = [str(Id) for Id in range(len(splitted_document))]
collection.add(
    ids=ids,
    documents=splitted_document
)

Эта строка кода 'collection.add' занимает больше времени.

Я хочу запускать процесс в фоновом режиме, особенно в виде параллельного процесса. Я пробовал использовать Celery с ChromaDB, но документы не добавляются. Я проверил это с помощью collection.count(), и он вернул 0. Почему так происходит?

Вот код:

# main.py 

def FileLoader(file_path):
 # Code to split the document... 
 ... 
 ... 
     
 ids = [str(Id) for Id in range(len(splitted_document))] 

 collection.add( ids=ids,
                documents=splitted_document 
              ) 

# Call the function process_file.delay(file_path)



# tasks.py  
@shared_task 
def process_file(file_path): 
 return FileLoader(file_path)

Однако никакие документы не добавляются.

Вернуться на верх

Последние вопросы и ответы

How can I send a POST request with a CSRF Token and a JSON body to a Django endpoint?

How to configure/debug Python chat application on a production Ubuntu system

ImportError in old migrations (django.utils.timezone.utc) after upgrading Python and Django

Django tests in GitLab CI always use PostgreSQL instead of SQLite despite APP_ENV override

Serializers Prefetch in View

How to separate local and production settings in django?

How to fix issue with passing class instances between methods in Python (Django context)?

How to properly store image dimensions in Django

ModuleNotFoundError: No module named 'pkg_resources' With Django Project

Handling user registration and subsequent profile creation

Как повысить скорость добавления документов в chromaDB?

Последние вопросы и ответы

Рекомендуемые записи по теме