extract_eur.py

import requests
from PyPDF2 import PdfReader
from io import BytesIO
import re

def extract_eur():
    # Define the URL of the PDF
    pdf_url = "https://www.hsbc.lk/content/dam/hsbc/lk/documents/tariffs/foreign-exchange-rates.pdf"

    # Send a GET request to fetch the PDF content
    response = requests.get(pdf_url)

    # Open the PDF content in memory
    pdf_file = BytesIO(response.content)

    # Open the PDF file from memory
    pdf_reader = PdfReader(pdf_file)

    # Extract text from each page
    num_pages = len(pdf_reader.pages)
    for page_num in range(num_pages):
        page = pdf_reader.pages[page_num]
        page_text = page.extract_text()

        # Search for the USD selling rate
        if "Euro" in page_text:
            selling_rate_index = page_text.index("Euro")
            selling_rate_text = page_text[selling_rate_index:]

            matches = re.findall(r"\d+\.\d+", selling_rate_text)

            return matches[0]

    # Return None if the USD selling rate is not found
    return None