Chcel som si rýchlo prezrieť počet slov v mojich blogových príspevkoch, aby som si mohol hrubо odhadnúť náklady na preklad. Tu je jednoriadkový príkaz, na ktorý som prišiel:
find . -maxdepth 1 -type f -name "*.md" -exec printf "{} " \; -exec ~/.local/bin/mwc {} \; | awk '{print $2 " " $1}' | sort -rnk1
Výstup by mal vyzerať podobne ako toto:
1862 ./becoming-better-presentation-creator.md
1739 ./make-ssh-prompt-password-keepassxc.md
1619 ./are-otp-secrets-stored-plaintext.md
1602 ./how-not-create-node-executable-arm.md
1596 ./three-reasons-spent-time-nature-programmer.md
1536 ./keep-gnome-shell-settings-dotfiles-yadm.md
1407 ./how-update-gooogle-calendar-pre-push-hook.md
1390 ./story-about-nfc-thinkpad-t470.md
1211 ./building-on-your-previous-work.md
1179 ./lockdown-travel-sms-sync-phone-reset.md
1038 ./most-useful-keyboards-android.md
1033 ./how-use-flashrom-archlinux-arm.md
...
Príkaz mwc by mal vynechávať interpunkciu, poznámky pod čiarou a iné
špeciality markdownu, ale zatiaľ som to podrobnejšie nepreskúmal. Napriek
tomu by mal byť dostatočný na to, aby som si urobil všeobecnú predstavu o
nákladoch na preklad. Zaujíma ma, či sú prekladatelia zvyknutí prekladať
markdown.
Požiadavky #
Vyššie uvedený príkaz vyžaduje príkaz mwc, čo je pythonovský skript
markdown-word-count.
Nainštalovať ho možno cez pip:
pip3 install markdown-word-count
Okrem tohto skriptu príkaz vyžaduje len štandardné GNU nástroje.
Odkazy #
- Posielanie výstupu
lsdoxargsmôže priniesť veľa bezpečnostných rizík odkaz - Môže byť lepšie zvážiť použitie
find -execnamiesto toho odkaz - Existujú nevyhnutné bezpečnostné problémy pri použití akcie
-exec; namiesto nej by ste mali použiť možnosť-execdirodkaz - Jednoduché zadanie viacerých parametrov
-execdirpríkazufindpostačí odkaz - Zúženie výsledkov príkazu
findje voliteľné odkaz - Použitie
awkna zámen stĺpcov je veľmi jednoduché odkaz - Triedenie výstupu podľa stĺpca sa určuje parametrom
-kodkaz
Toto je 55. príspevok #100daystooffload.