Dicas Web de Dan:

Diretórios e arquivos de índice padrão

Estruturar seu site

DICA: Faça uso inteligente de subdiretórios para estruturar logicamente o seu site, facilitar a manutenção, e dar partes do seu site URLs memoráveis.

Um site não precisa ser tudo em um diretório. Você pode usar subdiretórios (o gráfico-ambiente tipos tendem a chamar de "pastas" nos dias de hoje, mas nós computerists velhos tempos preferem o termo mais técnico) dentro do seu site. Essa é uma boa maneira de separar o seu conteúdo de uma maneira lógica e de fácil manutenção. Se você simplesmente despejar tudo em um diretório, ele vai ter pesado muito rápido. Subdiretórios podem ser usados ​​para as seguintes finalidades:

  1. Para separar o conteúdo do seu site em sub-sites lógicos. Se seu site tem divisórias de pontos sensíveis, dar a cada parte um subdiretório separado. Por exemplo, um site corporativo pode ter um diretório para a comercialização de informações sobre seus produtos, outra para obter informações de suporte técnico, e um terceiro para os relatórios de acionistas. Um subdiretório pode ser dividido por sua vez em sub-subdiretórios no próximo nível: o diretório de marketing pode ter um subdiretório para cada linha de produto.
  2. Para colocar gráficos em um diretório separado dos arquivos HTML. Ao editar os arquivos HTML e quer enviá-los todos para o servidor, você não vai querer perder tempo fazendo o upload os gráficos inalterada ao longo novamente, mas você vai ter dificuldade em separá-los a partir do HTML quando eles estão todos misturados .
  3. Da mesma forma, se você tem arquivos de som, Java applets, ou outros multimedia add-ons, use diretórios separados para cada tipo de conteúdo para manter as coisas em linha reta.

DICA: Depois de decidir sobre a sua estrutura de arquivo e de diretório nomes, não alterá-los, a menos que você tem uma muitoboa razão!

Decidir sobre a estrutura de diretórios do seu site no início, quando você começar a trabalhar nele; é muito mais fácil de desenvolver e manter um site que começa com uma estrutura sensato do que tentar mudar a estrutura de um site depois de ele já está evoluído ao acaso. E se você alterar os nomes de arquivos e diretórios depois que o site já foi por um tempo, você vai quebrar todos os marcadores, links, e as entradas que foram feitas às partes de seu outro do que a home page principal local de motores de busca. Então venha com nomes sensatas desde o início, e tentar evitar alterá-los posteriormente, a menos que seja absolutamente necessário. Mesmo uma mudança "trivial" como a mudança de todos os seus .htmlarquivos para .htmou vice-versa vai quebrar links, para evitá-lo!

Nota: Ambos .html e .htm são extensões comuns para documentos HTML. .html é geralmente considerado como a extensão mais "adequada", que significa o nome do formato documento completo "HyperText Markup Language", mas .htm entrou em uso no início da história da Web por causa de desenvolvedores que usam sistemas operacionais como o MS- DOS ou Windows 3.1 que foram limitados a extensões de três letras. Hoje em dia, com poucas pessoas que utilizam esses sistemas operacionais na Internet, e com programas de FTP modernas que suportam uma opção para adicionar a letra extra ao final de nomes de arquivos em upload, existem alguns bons motivos para usar a extensão mais curta, e algumas pessoas pensam URLs olhar "extravagante" com a curta extensão. Algumas ferramentas de criação, especialmente aqueles criados pela Microsoft, ainda o padrão para esta extensão, de modo que muitos sites de usá-lo mesmo quando o sistema dos desenvolvedores não tem a limitação que lhe deu origem. Na verdade, uma das superstições comuns na nomeação de arquivos é que os nomes devem ser limitadas a 8 letras mais uma extensão de 3 letras; isso já não é verdade para a grande maioria dos sistemas de uso corrente, e até mesmo sistemas que ainda são limitados desta maneira não tem nenhum problema visitar sites com nomes de URL não cumprir esta limitação é.

Aqui é um lugar tão bom quanto qualquer outro para lembrá-lo que, em servidores UNIX (que é o que uma grande parte dos sites usam), nomes de arquivos são case-sensitive. Um nome em letras maiúsculas como INDEX.HTMLé diferente de um em letras minúsculas como index.html, e ambos são diferentes umas das possibilidades mistos como Index.Htmlindex.HTML. Então, quando você está criando novos arquivos e diretórios em um site, estar atento para saber se você está nomeando-os em letras maiúsculas ou minúsculas, e ser consistente. Todos os links para um determinado arquivo terá que concordar em caso com a maneira como o arquivo está no servidor. A menos que haja uma boa razão para fazer o contrário, você deve usar todas as letras minúsculas em seus nomes; que geralmente é a maneira como os usuários são usados para entrar URLs. (Mesmo se o servidor é um, como o Windows NT, que não usa nomes de arquivos case-sensitive, você ainda deve ser consistente no caso em seus links, uma vez que as versões de casos diferentes são URLs diferentes, mesmo que recuperar o mesmo arquivo, e será armazenada separadamente pelo espaço navegador e memória resíduos e tempo de download.)

Arquivos de índice padrão

DICA: Use o arquivo de índice padrão de forma sensata para simplificar a URL do seu site. Faça o mesmo para os subdiretórios, para simplificar as URLs das suas sub-sites.

Quase todos os servidores Web tem um arquivo padrão, normalmente index.html , mas às vezes default.html , welcome.html ou default.htm , que será carregado automaticamente quando um nome de diretório é usado como a URL. Você pode aproveitar este para fazer a sua URL mais curta e mais elegante procurando-. Muitos usuários não sabem disso e usar URLs como:

http://www.someplace.net/~msmith/marysmith.html

Se Mary nomeou seu principal página index.html , ela seria capaz de lhe dar URL como:

http://www.someplace.net/~msmith/

Algumas pessoas ficam nesta parte direita, e dar o seu URL como:

http://www.someplace.net/~msmith/index.html

Eles usaram o nome do arquivo correto, mas não percebeu que eles não tem que realmente escrever esse nome. O nome do diretório sozinha é suficiente, é mais fácil de digitar, e parece mais agradável. (Veja as notas abaixo sobre ligando de volta para sua home page.)

Coloque um arquivo de índice padrão em cada diretório, até mesmo diretórios que realmente não precisa de um (por exemplo, seu diretório gráficos). Se não o fizer, um usuário que entra o nome do diretório como um URL irá obter uma listagem de diretório cru, e você pode ter arquivos que você preferir usuários aleatórios não vê (como as páginas que ainda estão em construção). A "dummy" arquivo de índice impede que tal espionagem.

Barra final em Pathnames

DICA: Não deixe a barra de fechamento de URLs diretório conhecidos!

Sempre incluir a barra final (/) no final de um URL que termina num nome do directório. Se você usar:

http://www.someplace.net/~msmith

(sem a barra), o navegador vai primeiro tentar recuperar um arquivo em vez de um diretório, e somente quando o servidor percebe que ~ msmith é um nome de diretório que vai dizer ao navegador para adicionar a barra e tente novamente. Isso leva uma rodada de comunicação adicional entre o navegador eo servidor, retardando a recuperação. Além disso, o navegador não sabe de antemão que o endereço sem a barra vai para a mesma página que o um com ele, por isso não irá mostrar o link na "-link visitado" cor se o usuário já fui lá, e não tirar proveito de uma cópia anteriormente em cache da página que pode existir.

Pior ainda, há alguns navegadores antigos (algumas versões do Mosaic, por exemplo) que não lidar com este tipo de redirecionamento corretamente. Eles podem puxar para cima a página da Web correta sem a barra, mas, em seguida, deixar de lidar com links relativos da página corretamente. Um link para stuff.html do URL http://www.someplace.net/~msmith/ deve acabar indo parahttp://www.someplace.net/~msmith/stuff.html , mas se o corte for omitido eo software de navegação não é inteligente o suficiente para adicioná-lo uma vez que é redireccionado pelo servidor, ele vai pensar que é realmente um nível de diretório superior na árvore, e analisar a URL relativa como http://www.someplace.net/stuff. html . Este, então, causar um erro 404 Not Found, e o usuário não vai saber porquê.

Se você estiver usando o <BASE HREF="...">elemento para especificar um URL base para o seu site, é ainda mais importante para incluir a barra final; não vai funcionar sem ele, como o navegador irá analisar referências relativas utilizando o nível de diretório de um maior do que o pretendido.

Um site muito proeminente cujos criadores não conseguiram atender o meu conselho sobre arrastando barras é a publicação oficial do governo do Starr Relatório Ken sobre as relações do presidente Clinton com estagiária Monica Lewinsky. Devido a campanha publicitária de notícias de comunicação social, este relatório (publicado a vários sites oficiais do governo em 11 de setembro de 1998, e pouco depois a vários sites do setor privado também) tem parte do tráfego mais pesado Internet nunca, fazendo com que os servidores sejam tão sobrecarregado nas primeiras horas do relatório foi-se que a maioria das pessoas não pôde se conectar. Infelizmente, o governo adicionado a esse problema usando versões dos URLs desses sites que não possuem a barra final em todos os lugares que eles divulgado ou vinculados aos sites, assim, assegurar que cada acesso do site teria mais uma transação do servidor do que seria necessário se o barra tinha sido usada. Com o alto nível de tráfego que o site tinha na altura, este provavelmente adicionada a longos atrasos para acessos de muitas pessoas.

Outro motivo para usar fechar barras ...

Quando URLs são publicados na mídia impressa, como jornais, revistas e boletins, eles muitas vezes se colocar em frases com períodos no final. Alguns leitores (especialmente aqueles que são novatos na Web e inconsciente do que personagens são geralmente em URLs em que ordem) vão pensar que o período é parte do URL e digite-o em seus navegadores. Se o URL termina em uma barra, adicionando um período em que serão tratados pela maioria dos servidores como uma referência ao "dot-single" diretório de link simbólico, o que aponta para o diretório atual. Isso fará com que a mesma página que o usuário teria recebido sem o período extra (embora com um URL um pouco deselegante). Sem a barra de fechamento, acrescentando um período faz com que seja anexada ao seu nome solicitado, geralmente produzindo um erro 404 Not Found.

Uma nota final sobre barras ...

Dito tudo isso, é melhor eu lembrá-lo não com "overcorrect" adicionando barras para URLs que não deveriam tê-las. Se o URL faz referência a um arquivo em vez de um diretório , não deve haver uma barra no final. Então não escreva "http://www.someplace.net/~msmith/stuff.html/"!

Ligando Back Home

DICA: A home page é (geralmente) chamado index.html , mas não fazer o link com esse nome!

Quando ligando de volta para sua página principal a partir de outras páginas em seu site, use <A HREF="./">em vez de <A HREF="index.html">. Este "dot-slash" sintaxe faz com que o índice do diretório atual para ser carregado com a mesma sintaxe de URL que o usuário usado para acessar o site em primeiro lugar (nome do diretório sozinho), enquanto o último sintaxe envia o usuário para a URL com um "index.html" desnecessária anexado a ele, que o navegador não vai perceber é a mesma página e, portanto, não vai mostrar o link na "visitado" cor ou usar cópias em cache. Se as ligações de usuários ou bookmarks a página, eles vão acabar propagando sua elegante URL "index.html" menos- em vez do nome do diretório limpo. (Alguns WYSIWYG do tipo editores como o Microsoft Front Page recusam-se a deixá-lo fazer ligações a maneira que eu recomendo, mesmo mudando "./" links inseridos manualmente para "index.html" em você. Essa é uma das razões que eu odeio esses editores, e usar apenas editores de texto simples para fazer a minha edição de página.)

Nota: Como regra geral, você deve ser consistente e link para cada uma de suas páginas com uma URL única "canonical" por página, para que as caches "visitados" cor link e navegador funcionar corretamente. Minhas notas em ligando para o índice padrão e sempre usando fechamento barras nos links do diretório são dois exemplos desta; outros casos incluem sites que são acessíveis através de vários nomes de domínio ou de host: http://www.yoursite.com/e http://yoursite.com/ pode tanto trabalho, mas você deve escolher um deles como o modo padrão de links para seu site, em vez de misturá-los. Algumas pessoas propositadamente conectar-se a múltiplas variantes do seu endereço como uma forma de obter os motores de busca para indexar-los várias vezes, mas que me parece mais uma forma de "spamdexing" , e é chato como um usuário para encerrar com muitas cópias do mesma página aparecendo em um resultado de pesquisa.

Além disso, se você usar o mesmo gráfico em vários lugares, certifique-se de usar a mesma cópia do mesmo, na mesma URL , de modo que os navegadores podem usar a cópia em cache anteriormente de que em vez de recarregar cada vez.

Você pode usar arquivos de índice em cada subdiretório se você tiver várias pastas, para Mary pode fazer sub-sites em seus passatempos de colecionar selos e gatos como

http://www.someplace.net/~msmith/stamps/ 
http://www.someplace.net/~msmith/cats/

Em tal estrutura, os menus principais dos "selos" e "gatos" subsites serão os index.html arquivos desses respectivos diretórios, e não pode haver um número ilimitado de outros arquivos em cada um dos diretórios. Mas não confunda a estrutura, colocando o menu principal em outros lugares; Já vi sites que usam "stamps.html" no diretório pai como o menu principal do "selos" subsite, com o restante dos arquivos no "selos /" subdiretório. Este movimento ilógico separa o menu subsite a partir de seus arquivos relacionados, então eu não sei o que o desenvolvedor estava pensando quando ele ou ela fez isso.

Se você colocar o principal índice do subsite no diretório apropriado, mas não nomeá-lo como o índice de inadimplência, você acaba com URLs "redundantes", como:

http://www.someplace.net/~msmith/stamps/stamps.html

Eu gosto de chamar essas URLs URLs "Foo-slash-foo", já que eles são do formulário foo/foo.html(onde "foo" é um dos "totó do computador de" favorito nomes da comunidade "variável arbitrária", que representa qualquer cadeia de caracteres). URLs redundantes olhar um pouco bobo, e são mais do que a URL que você poderia ter tido usando arquivos padrão e citando o URL pelo nome do diretório sozinho. Eu mesmo vi URLs triply- ou quadruply-redundantes em sites que parecem sair de sua maneira de usar árvores de diretório excessivamente profundos e evitar o uso de índices de inadimplência, produzindo monstruosidades como:

http://www.foocorp.com/foocorp/foo/corp/foocorp.html

Provavelmente, o desenvolvedor simplesmente não estava pensando claramente ao planejar os nomes de arquivos e diretórios de tal site. Tu consegues fazer melhor!

NOTA: Eu pensei que quando eu vim com o exemplo acima "Foo Corp" que esta era uma URL artificial, exagerada utilizado para o efeito, e que eu não era susceptível de correr em um que mal no mundo real ... mas eu achei que o mlb.com endereço do site da major League Baseball redireciona para esta atrocidade:

http://mlb.mlb.com/NASApp/mlb/mlb/homepage/mlb_homepage.jsp

Quando liga para o diretório pai, use HREF="../"(dois pontos e uma barra); quando ligar a um "irmão" o uso do diretório HREF="../cats/"; o link para o índice de um subdiretório abaixo do atual, usar o nome sem quaisquer pontos ou barras antes que ele gosta HREF="stamps/". Para subir dois níveis para um "avô" uso diretórioHREF="../../"

Uma coisa a notar: Se você fizer as ligações da maneira que eu recomendo aqui, eles não funcionará quando você navegar através de suas páginas da Web em seu disco rígido, uma vez que o disco rígido não tem qualquer nome de arquivo "default" como um índice de diretório. Você vai ver o diretório crus quando você seguir essa ligação. Mas você está desenvolvendo seu site para ficar bem em seu disco rígido ou no servidor Web de destino? A menos que você está criando um site para distribuir em disquete ou CD-ROM para executar em ambientes fora da rede, o objetivo com o desenvolvimento é que o site funcione bem no servidor, assim que você deve colocar-se com um pouco de constrangimento quando você está testando-o em sua própria máquina antes de enviá-lo. Quando você seguir um link e um diretório cru vem para cima, isso não é um erro; basta clicar em "index.html" e seguir em frente, com a consciência de que este "problema" vai desaparecer uma vez que você colocar o site no servidor onde ele pertence. Se você precisa fazer uma versão do site, executado corretamente em um disco rígido ou disquete, existem alguns programas disponíveis para exportar um Web site para um disco no modo executável, que mudam automaticamente todos os links para nomes de arquivos válidos em vez de nomes de diretório. Teleport Pro e WebSnake são dois desses programas, disponíveis através TUCOWS .