php 的 DOMDocument 的 loadHTML() 出现乱码的解决方法

发布于 2019-12-19 11:45:59

这种情况大多原因是因为导入的HTML不完整,没有meta 头部信息造成的

<meta http-equiv="Content-Type" content="text/html;charset=utf-8">

解决方法也很简单,只要把导入的HTML补全信息就好了。例如:

$url = 'http://218.240.145.213:9000/CTMDS/pub/PUB010100.do?method=handle07&compId=FCB3E731C0A8023376CB5A29511E9006&_=1576720810762';
        $html = $this->curl($url);
        // 补全信息,如果没有这段代码,则会出现乱码
        $html = '<html><head><meta http-equiv="Content-Type" content="text/html;charset=utf-8"><title>百度一下,你就知道   </title></head><body>'.$html.'</body>';
        $dom = new \DOMDocument();
        @$dom->loadHTML($html);
        echo $dom->textContent;
0 条评论

发布
问题