changes (seeing if they work)

author: A.J. Shulman <Shulman.aj@gmail.com> 2025-07-07 14:39:06 -0400
committer: A.J. Shulman <Shulman.aj@gmail.com> 2025-07-07 14:39:06 -0400
commit: 9092494778abd55b6aa299fe06b4f70e7c7a767f (patch)
tree: 28aedb8db51224374e1a31d9557ffd28e1c7e8f9 /src/server/chunker/pdf_chunker.py
parent: 86c666427ff8b9d516450a150af641570e00f2d2 (diff)
1 files changed, 1 insertions, 1 deletions
diff --git a/src/server/chunker/pdf_chunker.py b/src/server/chunker/pdf_chunker.py
index 04d9f51a4..914594f1e 100644
--- a/src/server/chunker/pdf_chunker.py
+++ b/src/server/chunker/pdf_chunker.py
@@ -307,7 +307,7 @@ class PDFChunker:
             page_texts = await self.extract_text_from_masked_pages(pages, job_id)  # Extract text from masked pages
 
             update_progress(job_id, "Processing text...", 0)
-            text_chunks = self.chunk_text_with_metadata(page_texts, max_words=1000, job_id=job_id)  # Chunk text into smaller parts
+            text_chunks = self.chunk_text_with_metadata(page_texts, max_words=2000, job_id=job_id)  # Chunk text into smaller parts
 
             # Combine text and visual elements into a unified structure (chunks)
             chunks = self.combine_chunks(text_chunks, [elem for page in pages for elem in page.elements], file_name,
author	A.J. Shulman <Shulman.aj@gmail.com>	2025-07-07 14:39:06 -0400
committer	A.J. Shulman <Shulman.aj@gmail.com>	2025-07-07 14:39:06 -0400
commit	9092494778abd55b6aa299fe06b4f70e7c7a767f (patch)
tree	28aedb8db51224374e1a31d9557ffd28e1c7e8f9 /src/server/chunker/pdf_chunker.py
parent	86c666427ff8b9d516450a150af641570e00f2d2 (diff)