小專案 Online PDF Viewer and Parse Data compare:

  • https://github.com/kkdai/pdf_online_editor
  • 比對你準備要導入的檔案,透過 PyPDF 。
  • 有在使用 PDF vector embedding 的人,但是又不知道導入資料長什麼樣子,可以透過這個小工具來查看 build by streamlit。

image-20230805094306589

最近由於在弄 LangChain 花了很多時間在玩 Python ,不過很多東西之前沒注意過。這裡稍微筆記一下:

  • PyPDF2 有 CVE 問題,其實切回PyPDF
  • 可以用 pip freezepipreqs搭配使用來打造 requirements.txt
  • Heroku 可以透過 Aptfile 來達到安裝 apt get 套件的方式:
    • 導入 "url": "heroku-community/apt" buildpack
    • 加入 Aptfile 裡面放你需要的套件清單 (e.g. pyimage 需要 poppler-utils)
    • 參考: How to add apt packages to Heroku 不然就是上面的 repo 。
  • Streamlit 是個好工具,對於我這種前端小白,提供了以下一些超好用東西:

Buy Me A Coffee

Evan

Attitude is everything