2017.11.24
2020.1.7

HTMLの内容を文字列として取得する(Html Agility Pack)

Html Agility Packで読み込んだHTMLファイルの内容を文字列として取得する方法です。

コード


var doc = new HtmlDocument();
doc.Load(@"c:\temp\index.html");

Console.WriteLine(doc.DocumentNode.OuterHtml);

HtmlDocumentのメソッドに「ParsedText」というプロパティがありますが、こちらは変更前の内容が取得できるだけなので、HTMLの内容を追加や修正した内容を文字列として取得したい場合、上記のように「DocumentNode.OuterHtml」を利用します。

参考リンク

C#】関連記事