English Auto Correct

English Auto Correct is a simple spell-correction tool based on word frequency from a large text corpus. This project uses the Leipzig English dataset to clean, prepare, and process text for auto-correct suggestions.

How It Works

The process involves:

Data Cleaning: Removing unwanted characters such as leading numbers and non-word characters.
Corpus Preparation: Building a frequency dictionary by counting word occurrences.
Generating Edits: Creating possible variations of the word (deletions, transpositions, replacements, insertions).
Search for Correct Word: Checking generated edits against the frequency dictionary.
Providing Suggestions: Suggesting the most likely correction based on word frequency.

Example

Here’s a simple example of how the auto-correct functionality works:

Input: "appl"
Output: "apple"

Sample Image

Here’s an illustration of how English Auto Correct works:

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
.idea		.idea
AutoCorrect		AutoCorrect
__pycache__		__pycache__
data		data
src		src
static/css		static/css
templates		templates
Documentation.pdf		Documentation.pdf
README.md		README.md
Speller.py		Speller.py
app.py		app.py
requirments.txt		requirments.txt
vercel.json		vercel.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

English Auto Correct

How It Works

Example

Sample Image

About

Releases

Packages

Contributors 2

Languages

janith99hansidu/Developing-Auto-Correct-Sinhala

Folders and files

Latest commit

History

Repository files navigation

English Auto Correct

How It Works

Example

Sample Image

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages