wgetのリンクが繋がっているサイト全部落とすやつのダウンロードしないオプションでログ取って加工したら何とかなりそうな気がする。しらんけど。
wgetでサイトのリンク切れURLを調査する | 俺的備忘録 〜なんかいろいろ〜
https://orebibou.com/2017/07/wget%E3%81%A7%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E3%83%AA%E3%83%B3%E3%82%AF%E5%88%87%E3%82%8Curl%E3%82%92%E8%AA%BF%E6%9F%BB%E3%81%99%E3%82%8B/