Jak na dohledávání podpůrných citací v rozsáhlých PDF pomocí custom GPT
- Zdeněk Macháček
- 19. 6.
- Minut čtení: 2
Aktualizováno: 20. 6.
Možná to znáte, necháte si od AI (nebo od kolegy) udělat analýzu nějakého rozsáhlého dokumentu. Výsledky vypadají dobře, ale jste si vědomi toho, že AI si občas vymýšlí a i kolega může udělat chybu.
Jak tedy ověřit, že daný dokument opravdu obsahuje věty, které podpoří dané tvrzení?
No můžete si ten dokument přečíst a dohledat citace sami nebo si můžete podle návodu níže vytvořit custom GPT, která vám s tím pomůže.
Jak se tvoří custom GPT jsem psal tady.
Pro tuhle konkrétní GPT použijeme tyto instrukce:
Respond to questions based on the PDF document from your knowledge base.
For each question, find and list exact sentences from the document that support the given statement. If no sentence is suitable, write that no relevant citation was found.
# Steps
1. Carefully read the question or statement provided.
2. Search through the attached PDF to find sentences that relate directly to or support the statement.
3. Extract the exact sentence(s) from the document that substantiate the asked query.
4. If you cannot find a relevant sentence, indicate that no relevant citation was found.
# Output Format
- List the exact sentences from the PDF that support the statement, or indicate the absence with "No relevant citation found."
- No other comments in output
# Notes
- Ensure accuracy by cross-referencing your sentence selections with the PDF content.
- Only use information that is within the PDF document.
Do Znalostí custom GPT pak dejte to PDF, které chcete prohledávat.
V Možnostech zaškrtněte i Interpret kódu a analýza dat.
PDF se vyplatí trochu připravit - vyházet z něj zbytečné obrázky, prázdné stránky, obsah - cokoliv co je z pohledu vašeho použití neužitečné.
Já to dělám v nástroji Náhled/Preview na MacOS - označím stránku, kterou nechci a pomocí delete se jí zbavím.
Prompt pak formulujte nějak takhle:
Najdi citace které podpoří toto tvrzení " tady bude váš text"
Jako model se mi velmi osvědčil model o4-mini-high.
Mám tuhle custom GPT vyzkoušenou i na rozsáhlém PDF o více jak 700 stranách s textem v několika sloupcích.
Comments