あるサイトのお知らせから必要な種類の情報だけをピックアップしたい(しなければならない)こととなりました。本質的な議論はさておき、元のサイトに技術的にも運用的にも手を入れないで実現してみよう、と思い、RPAとGASを用いてみました。
役割分担としてはRPAでお知らせ(リンク)の自動取得(Webスクレイピング)をしてCSV化、これをGAS(Google Apps Script)でSpreadsheetに展開し、リンクとして属性を与える加工を行い、これをGoogleサイトでインライン展開することで、特定の種類のお知らせだけのお知らせ集を実現しました。
RPAもGASも定期的に実行するように登録すれば完了です。RPA(特に自作部分)のバグで情報漏洩したら目も当てられません。そのため、他にも自動処理のために運用している、それ自体には他の秘匿が必要な情報を蓄積していないPC上で動作させています。Windowsなのでタスクスケジューラで定期的に実行させています。GASではトリガーを使っています。トリガーのほうが起動時間を指定できないので、一定期間内に最新版になればよい、という緩い運用でよしとしました。
すべてをRPAで実現する方法もあると思うのですが、HTML化の部分はGAS+Spreadsheetで十分、簡単でした。