Как уменьшить использование оперативной памяти при загрузке модели
когда я пытаюсь загрузить модель в моем views.py, использование оперативной памяти увеличивается, после чего становится нормальным, Как сделать так, чтобы она всегда использовалась нормально?
Я использую модель Wave2Vec2Inference("facebook/hubert-xlarge-ls960-ft",cuda_flag = True) может ли кто-нибудь помочь мне