-
Notifications
You must be signed in to change notification settings - Fork 0
/
main.go
153 lines (128 loc) · 3.97 KB
/
main.go
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
package main
import (
"encoding/json"
"flag"
"fmt"
"github.com/semyon-dev/hh.ru-search/elastic"
"github.com/semyon-dev/hh.ru-search/hhAPI"
"log"
"net/http"
"strconv"
"strings"
"sync"
"time"
)
var portFlag string // порт
func init() {
flag.StringVar(&portFlag, "p", "8080", "you can choose specify the port")
}
func main() {
flag.Parse() // парсинг флагов
elastic.Init()
if !elastic.IsIndexExist("full_vacancies") {
fmt.Println("Парсинг изначальных данных...")
parseVacancies("Golang")
fmt.Println("Парсинг изначальных данных закончился")
}
mux := http.NewServeMux()
mux.Handle("/vacancies/", http.HandlerFunc(vacanciesHandler))
mux.Handle("/parse-vacancies/", http.HandlerFunc(parseVacanciesHandler))
fmt.Println("Запускаем REST API на порту " + portFlag + " [описание API в README]")
err := http.ListenAndServe(":"+portFlag, mux)
if err != nil {
log.Fatal(err)
}
}
// парсер вакансий из hh.ru
func parseVacanciesHandler(w http.ResponseWriter, r *http.Request) {
searchText := r.URL.Query().Get("text")
if searchText == "" {
searchText = "Golang"
}
parseVacancies(searchText)
_, err := w.Write([]byte(`{"message":"ok"}`))
if err != nil {
log.Println(err)
}
}
// handler для парсинга вакансий
func parseVacancies(searchText string) {
// получаем первую страницу вакансий
vacanciesPerPage := hhAPI.GetByText(searchText, "")
var wg sync.WaitGroup
wg.Add(vacanciesPerPage.Pages)
var m sync.Mutex
var fullVacancies elastic.FullVacancies
// далее запрашиваем каждую страницу
for pageNumber := 0; pageNumber < vacanciesPerPage.Pages; pageNumber++ {
go func(page int) {
defer wg.Done()
vacanciesPerPage := hhAPI.GetByText(searchText, strconv.Itoa(page))
var status = 200
for i := 0; i < len(vacanciesPerPage.Items); i++ {
// если status == 429 то лимит API превышен
// но мы не теряем вакансию, запрос будет сделан позже из списка неудачных
if status == 429 {
time.Sleep(200 * time.Millisecond)
}
var fullVac *elastic.FullVacancy
fullVac, status = hhAPI.GetByID(vacanciesPerPage.Items[i].Id)
m.Lock()
fullVacancies = append(fullVacancies, fullVac)
m.Unlock()
}
}(pageNumber)
}
wg.Wait()
fullVacancies.InsertMany()
}
// handler для получения вакансий
func vacanciesHandler(w http.ResponseWriter, r *http.Request) {
// сначала проверяем указан ли ID, если да, то возвращаем конкретную вакансию
// в стандартной библиотеки нет функционала для получения path params, поэтому используем TrimPrefix
idVac := strings.TrimPrefix(r.URL.Path, "/vacancies/")
_, err := strconv.Atoi(idVac)
// если это число значит запросили вакансию по id
if err == nil {
var msg []byte
res, isFound := elastic.Get(idVac)
if !isFound {
msg = []byte(`{"message":"not found"}`)
} else {
msg = res
}
_, err = w.Write(msg)
if err != nil {
log.Println(err)
}
return
}
var rawJson []*json.RawMessage
var size int
if r.URL.Query().Get("size") != "" {
size, _ = strconv.Atoi(r.URL.Query().Get("size"))
}
if size == 0 {
size = 1000
}
// если текст не указан - возвращаем все
if r.URL.Query().Get("text") == "" {
fullVacs := elastic.GetAll(size)
for _, v := range fullVacs {
rawJson = append(rawJson, &v.Source)
}
} else {
rawJson = elastic.Search(r.URL.Query().Get("text"), size)
}
res, err := json.Marshal(rawJson)
if err != nil {
log.Println(err)
}
if res == nil || len(res) == 0 || string(res) == ("null") {
res = []byte(`{"message":"not found"}`)
}
_, err = w.Write(res)
if err != nil {
log.Println(err)
}
}