Чтение загруженного файла в функции django

Я загружаю файл с фронтэнда и пытаюсь прочитать его в бэкэнде, чтобы сделать извлечение данных из него. Я написал следующий код, который не работает во всех сценариях

Views.py

class UserInfo(View):

    template_name = "Recruit/recruit.html"

    def get(self, request):
        user = UserInformationFrom()
        return render(request, self.template_name, {"form": user})

    def post(self, request):
        user = UserInformationFrom(request.POST, request.FILES)
        output = dict()
        HTMLExtensionList = ['.html','.htm']
        if user.is_valid():
            savedUser = user.save()
            filename = user['file'].data.name
            name, extension = os.path.splitext(filename)
            if extension.lower() in HTMLExtensionList:
                output = readHTML(filename=user['file'].data)
            savedUser.email = output['Email']
            savedUser.mobile = output['Phone']
            savedUser.Zipcode = output['zipCode']
            savedUser.state = output['state']
            savedUser.upload_by = request.user
            savedUser.updated = timezone.now()
            savedUser.save()
            return render(request, self.template_name, {"form": user})
        else:
            return render(request, self.template_name, {"form": user})

DataExtract.py

def readHTML(filename):
    with open(filename, "r", encoding='utf-8') as file:
        soup = BeautifulSoup(file)
        for data in soup(['style', 'script']):
            data.decompose()
        var = ' '.join(soup.stripped_strings)
    email = ExtractEmail(var)
    phone = findPhone(var)
    zipCode = extractZipCode(var)
    state = extractState(var)
    return {"Email": email, "Phone": phone, "zipCode": zipCode, "state": state}

Я получаю следующую ошибку

ожидается str, bytes или объект os.PathLike, а не InMemoryUploadedFile

.

Я получаю ошибки в DataExtract, когда пытаюсь открыть файл. Я пробовал это решение, все равно не работает

ожидается str, bytes или объект os.PathLike, а не InMemoryUploadedFile

Ну, поскольку ваша функция readHTML ожидает имя файла, вам нужно передать ему именно имя, а не просто файл.

Переформулируйте readHTML в функцию, которая может считывать входные данные только из строки:

def read_html_string(s):
    soup = BeautifulSoup(s)
    for data in soup(["style", "script"]):
        data.decompose()
    var = " ".join(soup.stripped_strings)
    email = ExtractEmail(var)
    phone = findPhone(var)
    zipCode = extractZipCode(var)
    state = extractState(var)
    return {"Email": email, "Phone": phone, "zipCode": zipCode, "state": state}

# If you still need this for something...
def readHTML(filename):
    with open(filename, "r", encoding="utf-8") as file:
        return read_html_string(file.read())

Тогда просто сделайте

output = read_html_string(user['file'].data.read())

в вашей функции просмотра.

Попробуйте передать InMemoryUploadedFile непосредственно в класс BeautifulSoup следующим образом:

def readHTML(file):
    soup = BeautifulSoup(file)
    for data in soup(['style', 'script']):
        data.decompose()
    var = ' '.join(soup.stripped_strings)
    email = ExtractEmail(var)
    phone = findPhone(var)
    zipCode = extractZipCode(var)
    state = extractState(var)
    return {"Email": email, "Phone": phone, "zipCode": zipCode, "state": state}

очевидно, что ошибка исходит из этой строки: with open(filename, "r", encoding='utf-8') as file, поэтому, возможно, вам не нужно вызывать open, чтобы иметь возможность прочитать файл

источник: https://tutorialmeta.com/question/expected-str-bytes-or-os-pathlike-object-not-inmemoryuploadedfile

Вернуться на верх