GASの勉強中にスクレイピングでIMGタグ内の属性の中身を取得するところで若干躓いたので、今回はそのやり方を備忘録も兼ねて残しておきたいと思います。
IMGタグの属性を取得する
例として冒頭で挙げたalt属性の中身を取得するコードを紹介します。
function getImgAlt(){
let target_HTML = '<img src="haribona.jpg" alt="はりぼなブログ" />';
let text_ImgAlt = Parser.data(target_HTML).from('alt="').to('" />').build();
Browser.msgBox(text_ImgAlt);
}
実行すると対象のHTMLコード内のalt属性が取得できます。
複数のIMGタグの属性を配列として取得する
次にimgタグが複数ある場合にalt属性の中身を取得する時のコードを紹介します。
配列として取得する時はbuildではなく、iterateを使用します。
function getImgAlt_Array(){
let target_HTML = '<li><img src="haribona.jpg" alt="はりぼなブログ_1" /></li>' +
'<li><img src="haribona.jpg" alt="はりぼなブログ_2" /></li>' +
'<li><img src="haribona.jpg" alt="はりぼなブログ_3" /></li>' +
'<li><img src="haribona.jpg" alt="はりぼなブログ_4" /></li>' +
'<li><img src="haribona.jpg" alt="はりぼなブログ_5" /></li>';
let text_ImgAlt = Parser.data(target_HTML).from('alt="').to('" />').iterate();
Browser.msgBox(text_ImgAlt);
}
実行すると対象のHTMLコード内のalt属性を全て取得&表示します。
まとめ
今回はスクレイピングでIMGタグの属性を取得する方法を紹介しました。
タグ内の属性を取得する時は、from側のカッコ内に該当する属性名を指定するようにしましょう。
今後もこんな感じでGASで躓いた所について不定期で投稿していこうと思っていますので、良ければ参考にしていただければと思います。
またこのブログではPC・Excel関係の投稿もしていますので、そちらも併せてご覧ください!
コメント