Чтение загруженного файла в функции django
Я загружаю файл с фронтэнда и пытаюсь прочитать его в бэкэнде, чтобы сделать извлечение данных из него. Я написал следующий код, который не работает во всех сценариях
Views.py
class UserInfo(View):
template_name = "Recruit/recruit.html"
def get(self, request):
user = UserInformationFrom()
return render(request, self.template_name, {"form": user})
def post(self, request):
user = UserInformationFrom(request.POST, request.FILES)
output = dict()
HTMLExtensionList = ['.html','.htm']
if user.is_valid():
savedUser = user.save()
filename = user['file'].data.name
name, extension = os.path.splitext(filename)
if extension.lower() in HTMLExtensionList:
output = readHTML(filename=user['file'].data)
savedUser.email = output['Email']
savedUser.mobile = output['Phone']
savedUser.Zipcode = output['zipCode']
savedUser.state = output['state']
savedUser.upload_by = request.user
savedUser.updated = timezone.now()
savedUser.save()
return render(request, self.template_name, {"form": user})
else:
return render(request, self.template_name, {"form": user})
DataExtract.py
def readHTML(filename):
with open(filename, "r", encoding='utf-8') as file:
soup = BeautifulSoup(file)
for data in soup(['style', 'script']):
data.decompose()
var = ' '.join(soup.stripped_strings)
email = ExtractEmail(var)
phone = findPhone(var)
zipCode = extractZipCode(var)
state = extractState(var)
return {"Email": email, "Phone": phone, "zipCode": zipCode, "state": state}
Я получаю следующую ошибку
ожидается str, bytes или объект os.PathLike, а не InMemoryUploadedFile
.
Я получаю ошибки в DataExtract, когда пытаюсь открыть файл. Я пробовал это решение, все равно не работает
ожидается str, bytes или объект os.PathLike, а не InMemoryUploadedFile
Ну, поскольку ваша функция readHTML ожидает имя файла, вам нужно передать ему именно имя, а не просто файл.
Переформулируйте readHTML в функцию, которая может считывать входные данные только из строки:
def read_html_string(s):
soup = BeautifulSoup(s)
for data in soup(["style", "script"]):
data.decompose()
var = " ".join(soup.stripped_strings)
email = ExtractEmail(var)
phone = findPhone(var)
zipCode = extractZipCode(var)
state = extractState(var)
return {"Email": email, "Phone": phone, "zipCode": zipCode, "state": state}
# If you still need this for something...
def readHTML(filename):
with open(filename, "r", encoding="utf-8") as file:
return read_html_string(file.read())
Тогда просто сделайте
output = read_html_string(user['file'].data.read())
в вашей функции просмотра.
Попробуйте передать InMemoryUploadedFile непосредственно в класс BeautifulSoup следующим образом:
def readHTML(file):
soup = BeautifulSoup(file)
for data in soup(['style', 'script']):
data.decompose()
var = ' '.join(soup.stripped_strings)
email = ExtractEmail(var)
phone = findPhone(var)
zipCode = extractZipCode(var)
state = extractState(var)
return {"Email": email, "Phone": phone, "zipCode": zipCode, "state": state}
очевидно, что ошибка исходит из этой строки: with open(filename, "r", encoding='utf-8') as file, поэтому, возможно, вам не нужно вызывать open, чтобы иметь возможность прочитать файл
источник: https://tutorialmeta.com/question/expected-str-bytes-or-os-pathlike-object-not-inmemoryuploadedfile