extract-content-mercury-utils
ai-research-agent / extractor/html-to-content/extract-content/extract-content-mercury-utils
Functions
brsToPs()
function brsToPs(document): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
cleanAttributes()
function cleanAttributes(article, document): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
any
cleanHOnes()
function cleanHOnes(article, document): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
any
cleanImages()
function cleanImages(article, document): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
any
convertNodeTo()
function convertNodeTo(
node,
document,
tag): any
Parameters
Parameter | Type | Default value |
---|---|---|
|
|
|
|
|
|
|
|
|
Returns
any
convertToParagraphs()
function convertToParagraphs(document): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
getAttrs()
function getAttrs(node): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
isWordpress()
function isWordpress(document): boolean
Parameters
Parameter | Type |
---|---|
|
|
Returns
boolean
linkDensity()
function linkDensity(node): number
Parameters
Parameter | Type |
---|---|
|
|
Returns
number
nodeIsSufficient()
function nodeIsSufficient(node): boolean
Parameters
Parameter | Type |
---|---|
|
|
Returns
boolean
normalizeSpaces()
function normalizeSpaces(text): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
paragraphize()
function paragraphize(
node,
document,
br): any
Parameters
Parameter | Type | Default value |
---|---|---|
|
|
|
|
|
|
|
|
|
Returns
any
removeEmpty()
function removeEmpty(article): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
removeUnlessContent()
function removeUnlessContent(node, weight): void
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
void
rewriteTopLevel()
function rewriteTopLevel(article, document): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
any
setAttr()
function setAttr(
node,
attr,
val): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
|
|
Returns
any
setAttrs()
function setAttrs(node, attrs): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
any
stripJunkTags()
function stripJunkTags(
article,
document,
tags): any
Parameters
Parameter | Type | Default value |
---|---|---|
|
|
|
|
|
|
|
|
|
Returns
any
stripTags()
function stripTags(text, document): any
Parameters
Parameter | Type |
---|---|
|
|
|
|
Returns
any
stripUnlikelyCandidates()
function stripUnlikelyCandidates(document): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
textLength()
function textLength(text): any
Parameters
Parameter | Type |
---|---|
|
|
Returns
any
withinComment()
function withinComment(node): boolean
Parameters
Parameter | Type |
---|---|
|
|
Returns
boolean