Url name crawler

Application crawles sites for its main page title. It has only one endpoint that accepts list of urls and returns list of responses for every url.

Run application:

sbt run

Application will run at host 127.0.0.1 and port 8080. To get names simply make GET request for url http://127.0.0.1:8080/urls/names with following structure:

{
    "urls": [
        "https://www.instagram.com", 
        "https://www.youtube.com/", 
        "asdfgfafs.gfvcx", 
        "амсчиа"
    ]
}

Service will answer something like this:

{
    "urls": [
        {
            "url": "https://www.instagram.com",
            "name": "Instagram"
        },
        {
            "url": "https://www.youtube.com/",
            "name": "YouTube"
        },
        {
            "url": "asdfgfafs.gfvcx",
            "error": "Tcp command [Connect(asdfgfafs.gfvcx:443,None,List(),Some(10 seconds),true)] failed because of java.net.UnknownHostException: asdfgfafs.gfvcx"
        },
        {
            "url": "амсчиа",
            "error": "Could not extract main page url"
        }
    ]
}

After application start, you can go to http://127.0.0.1:8080/api/v1/docs to see swagger ui docs.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
project		project
src		src
.gitignore		.gitignore
.scalafmt.conf		.scalafmt.conf
README.md		README.md
build.sbt		build.sbt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Url name crawler

About

Uh oh!

Releases

Packages

Languages

JennaWestenra/UrlNameCrawler

Folders and files

Latest commit

History

Repository files navigation

Url name crawler

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages