August 4th, 2023
小專案 Online PDF Viewer and Parse Data compare:
- https://github.com/kkdai/pdf_online_editor
- 比對你準備要導入的檔案,透過 PyPDF 。
- 有在使用 PDF vector embedding 的人,但是又不知道導入資料長什麼樣子,可以透過這個小工具來查看 build by streamlit。
最近由於在弄 LangChain 花了很多時間在玩 Python ,不過很多東西之前沒注意過。這裡稍微筆記一下:
- PyPDF2 有 CVE 問題,其實切回PyPDF
- 可以用
pip freeze
跟pipreqs
搭配使用來打造requirements.txt
- Heroku 可以透過
Aptfile
來達到安裝 apt get 套件的方式:- 導入
"url": "heroku-community/apt"
buildpack - 加入
Aptfile
裡面放你需要的套件清單 (e.g. pyimage 需要poppler-utils
) - 參考: How to add apt packages to Heroku 不然就是上面的 repo 。
- 導入
- Streamlit 是個好工具,對於我這種前端小白,提供了以下一些超好用東西:
- 各種的資料輸入格式
- Session State: 一個線上類似 cookie / session 的好東西